• musiic

    2009-03-14

    http://news.cnet.com/8301-1023_3-10194416-93.html

    又一个天才横空出世了

    youtube上什么歌都有,还是mtv

    音乐质量也非常之好

    http://www.youtube.com/watch?v=ZDUjt6iH52E&feature=related

     

  • camera calibration

    2009-03-13

    发觉各种问题的核心都是camera calibration

    只要camera calibration做的好,剩下的就比较简单

    核心问题:给定两个2D view的correspondences,怎么算?标准方法是先算F。如果有K,那么算R, t都很简单。不过呢,问题是,F有可能有问题,或者,K有问题,得到的E不好,也就是两个singular value不一样,如果差5%以上就有严重问题了。另外一种方法是,假定已经有K,每次直接算E(先算F),用E做ransac。这样的话应该好一些。如果没有K的话,就得做self-calibration。

    给定三个1Dview。怎么算。先算tensor,然后算e,然后算r,算t,然后triangulate。

    给定三维点,和image points。怎么算?

    给定一个view,怎么算?

    如果有lens distortion。怎么解决?

    如果是多个view,怎么解决?现在3d reconstruction。得到point cloud跟初始的两个cameras。后面的就不断的refine了。如果view degenerate怎么办?这个得先自动detect dominant plane homography。

     

  • match moving

    2009-03-08

    http://en.wikipedia.org/wiki/Match_moving

    有一些公司

    基本上都是欧洲的

    已经有点儿想创业了。。。。

  • magic numbers

    2009-03-06

    有些参数可以,有些参数不可以

    有些参数对数据A可以,但是对数据B就不可以

    对数据B可以的参数又对数据A不可以

    主要是F的计算,从F到E

    好的F可以得到好的E

    或者反过来,好的E对应好的F

    如果数据点有太多outliers或者分布不好,就极有可能得到不好的F,这是什么缘故?

    有时候调整一下参数,增大threshold或者减小threshold,就可以从一个不好的F得到一个好的F,这是什么缘故?

    怎么确保得到好的F?

    focall length对F到E的影响不大
    或者,从F到focal length应该有很大的ambiguity
    不过,这基本不影响metric reonstruction

    另外,相同的数据,有可能得到截然不同的F,这应该对应于dominant plane的问题,也就是H包含了大多数的inliers,那么怎么在这种情况下,获得一个好的F?或者,找到一个合适的epipole?是否不同的eipole都能得到好的E?

    纯粹uncalibrated算P非常不稳定,参数太多,随意的用一个K应该都好得多

     

     

  • 精益求精

    2009-03-03

    很小的时候学过这个道理,但是很少人能够做到这一点,包括我自己

    不知道是不是因为总是为一个又一个的最后期限疲于奔命,从而人陷于浮躁,什么事情交差就算了事

    觉得自己其实不够敬业

    敬业的人应该对任何的细节都严格要求,对任何细微的问题都不放过

    apple的招聘小本有这么一句话:“The clip on iPod shuffle. The iPhoto icon in Mac OS X. A glass elevator in the Apple Store, Fifth Avenue. Few companies on earth pay such attention to detail.”

    最后五个单词印象至深

    另外还有钻研二字。上大学的时候经常听到过。但是感觉自己做的相当不够。

    另外就是偏食症。喜欢philosophical的东西。细节研究不够。

    《大学》:“汤之盘铭曰,苟日新,日日新,又日新。”这句话是刻在商王汤的洗澡盆上的几行字。权当勉励。

  • innovid

    2009-02-27

    http://www.innovid.com/

    又是一个做augmented reality的公司。看来前途还真的不可限量。

    技术并不复杂。

     

  • 除草机器人

    2009-02-26

    http://news.cnet.com/8301-17912_3-10171944-72.html

    robot lawnmower

    开始还以为是帮助捡球的

    恩,如果有一个能捡球的机器人,肯定也很有前途

  • python

    2009-02-25

    用来写文件批处理非常方便

    用python写了两个打包程序,感觉很好

    不过前提是目录和文件结构比较规则,也就是说严格遵循某种规范

    ruby应该也可以做类似的事情

    sphinx里面好像文档源代码必须在source里面


  • scons

    2009-02-23

    目前的程序是每个模块一个目录,每个目录都有对应的_make, src, test等等。

    在类库以及工具的开发中,使用vs studio里面的denpendencies和vsprops来声明模块间的依赖关系

    这样每个模块都不会变得很臃肿,编译速度也快

    不过如果要给用户使用的话,引用很多的类库显然并不方便

    最简单的方式就是只编译出一个类库

    另外,在部署的时候也应该只有单个的src, lib, bin之类

    怎么从现在的目录结构生成部署的结构呢?

    或者,怎么build automation呢?

    找了一圈,决定用scons

    cmake好像很popular,但是很多地方我不喜欢,比如自己定义的一套语法,比如每个源文件目录都得有CMakeList文件等等。

    理想的情况是类似于ant这种工具

    不过nant好像是针对.net的。也可以用于c++,但是感觉还是很不方便,而且文档也很少

    转了一圈,还是又回到scons

    scons建立于python基础之上,所以python里面任何语法,函数和工具都可以直接使用

    感觉scons也很成熟,google chrome就用了scons

    scons的语法很简单,不过感觉文档不好,例子都太简单,网上的资料也不是很多,害得我花了很多时间搞明白一些简单的东西,有时间真想自己写一下文档

    今天又碰到一个链接的问题,是编译选项的问题,不过没有时间再琢磨怎么用scons解决了,明天还得跟老板交差

    感觉c++里面编译链接的学问很大,比如unicode或者multi-byte,比如静态类库或者动态类库,比如debug和release,比如single thread或multiple thread,等等。有时间得彻底研究归纳一下。

    最近找工作,很想花时间把开源的网站弄弄,加些文档和screenshot。但是太忙,总是抽不出足够的时间。

  • http://tech.sina.com.cn/i/2009-02-20/15302844380.shtml

  •  

    Audrey Avant

     to CSERATA
    show details 3:15 PM (4 hours ago)
    Reply
    Images are not displayed.
    Display images below - Always display images from Audrey.Avant@asu.edu

    Invited Talk: Dr. Xin Yao

    Title:  Co-Evolution, Games and Social Behaviors

    Friday, February 27, 2009

    BYENG 210

    10:00am – 12:00pm

     

    Professor Xin Yao (http://www.cs.bham.ac.uk/~xin/), CERCIA and Natural Computation Group,

    University of Birmingham, UK

     

    Abstract: The iterated prisoner's dilemma (IPD) game has been used extensively in modeling various real-world situations. This talk is concerned with the evolutionary approach to the IPD game. First, we generalize the game from the classical 2 player case to N (N>2) players and investigate the impact of the group size on the evolution. Second, we study a more realistic IPD game where more than two levels of cooperation’s are allowed. Surprisingly, more choices appear to discourage cooperation among players. Possible reasons for this are mentioned. Third, we introduce reputation into the IPD game and study

    its impact on the evolution of cooperation. It turns out that the reputation of a player is an important factor in encouraging cooperative behaviors. Finally, we present a rigorous theoretical framework of measuring generalizations of co-evolutionary learning quantitatively.

     

    Speaker's bio-sketch:  Xin Yao received the B.Sc. degree from the University of Science and Technology of China (USTC) in Hefei, in 1982, the M.Sc. degree from the North China Institute of Computing Technology in Beijing, in 1985, and the Ph.D. degree from USTC in 1990. He was awarded the President's Award for Outstanding Thesis by the Chinese Academy of Sciences for his Ph.D. work on simulated annealing and evolutionary algorithms in 1989. He took up a Postdoctoral Fellowship in the Computer Sciences Laboratory, Australian National University (ANU), Canberra, in 1990, and continued his work on simulated annealing and evolutionary algorithms. He joined the Knowledge-Based Systems Group, CSIRO (Commonwealth Scientific and Industrial Research Organization) Division of Building, Construction and Engineering, Melbourne, in 1991, working primarily on an industrial project on automatic inspection of sewage pipes. He returned to Canberra in 1992 to take up a lectureship in the School of Computer Science, University College, University of New South Wales (UNSW), Australian Defense Force Academy (ADFA), where he was later promoted to a Senior Lecturer and Associate Professor. Attracted by the English weather, he moved to the University of Birmingham, U.K., as a Chair of Computer Science on the April Fool's Day in 1999. Currently, he is the Director of the Centre of Excellence for Research in Computational Intelligence and Applications (CERCIA). He keeps himself entertained in his spare time by being the Editor-in-Chief of the IEEE Transactions on Evolutionary Computation (2003-08), an associate editor or editorial board member of twelve other journals, and the Editor of the World Scientific Book Series on "Advances in Natural Computation". He has given 50+ invited keynote/plenary speeches at conferences and workshops worldwide. His major research interests include evolutionary computation, neural network ensembles, global optimization and data mining. He has more than 300 refereed publications in those areas. He won the 2001 IEEE Donald G. Fink Prize Paper Award and several other best paper awards.

  • Qt, VC

    2009-02-19

    本来想要一个lightweight的C++ gui library的

    不过看来不大可能了

    找来找去还是Qt

    http://stackoverflow.com/questions/115045/good-c-gui-library-for-windows

    怎么在visual studio里面用呢?

    http://www.pc-maniac.com/

    注意第二步一定要这么干:programm files->visual studio 2008-> vs 2008 tools-> vs 2008 command promt

    不能直接到Qt目录下面configure,否则就老是报错

    一般好像就需要QtCore和QtGui

     

     

  • 一半要求至少公民身份

    一半要求至少绿卡身份

    剩下一个intel,可以F1身份,队伍都排到大门外N米去了

  • conversation

    2009-02-18

    师弟在starbucks买咖啡,听到两个老美这么一则对话:

    A: I just lost my job! I've been working at there for almost a year! They guarentee that they will hire me as soon as I graduate, and they just fire me!

    B: I havn't even start looking for job yet ....

    A: Have you considered working in China?

    B: Do you speak mandarin?

    A: Not really.

     

  • 乱七八糟

    2009-02-17

    早上又电面了一家公司

    感觉不是很好

    主要是语言问题

    感觉口语还是不流利

    另外有些问题准备的也不够充分

    虽然当时也都能说出来,但是因为缺乏充足的准备,导致有些结巴

    一个问题是你有没有stuck过?有没有人指导你?你怎么解决的?

    我把写sketchup plugin的例子说了一下,其实也是以前准备的,但是不知道这个例子别人会怎么评估,总感觉不够impressive

    另外一个问题是举一个你的代码里用design pattern的例子

    其实以前想过。但是今天一紧张又搞忘了。想了几秒钟然后就说了一个。但是感觉逻辑不是很清晰。后来想想,其实observer模式用过一段。用来log和demo。还有什么呢?再看看代码,嗯,iterator,用的比较多。然后也有template method,比如simulation部分。singleton以前用过,但是用的很少。其实c++ template用的比较多。我说了一下,然后另外一个技术哥们问我什么地方用template了?polymophism跟template的区别?效率差别?这几个问题也都回答出来了。我把我的open source网站给他们了,这样他们可以check一下我的代码。不过不知道他们会怎么评估。网站其实还需要更新,加入demos, examples和docs。不过这些都需要时间。

    总体感觉不是很好,第一个人似乎有些不耐烦。也许是因为我的语言问题吧。

    投了很多份简历,但是基本都没回信。

    昨晚做梦回到了故乡,见到了小学同学和高中同学,很开心。

    也许神要让我继续等待吧。

  • documentation tool

    2009-02-13

    发觉python的documentation做的很好

    仔细看了一下,发现底部有Created using Sphinx

    上了网站看了一下,也没仔细看。以为是一个从源代码生成文档类似于doxygen的东西

    但这不是我想要的,或者不是完全想要的

    又查了一下自动生成文档的工具

    感觉免费的最全的基本上也就是doxygen了

    但是给的几个sample,感觉基本上用处不大

    其实以前也用过

    我想要的是能做出类似于manual或者tutorial那样的东西

    对于代码来说,用户是很难直接从代码获得怎么使用代码的线索的

    examples比api docs要好的多

    不过怎么能把examples方便转换成documentation呢?

    或者,有没有非常方便的制作documentation的工具呢?

    搜了半天,发现这个词汇Help Authoring Tools

    搜这个词汇,可以得到很多很多的工具,都是用来写帮助文档的

    不过,几乎都收费,还贼贵

    免费的两三个也没啥用

    转了一圈又转回来

    看了看pov ray的manual

    没有任何制作工具信息

    再上网搜python tutorial

    希望能找到制作工具

    基本上没啥结果

    再点开网上的tutorial

    发现每一页左边有个"Show Source“

    眼睛一亮

    点开,是一个纯文本文档

    开始以为这不会是工具生成的吧?生成不同格式的文档

    后来再仔细研究

    发现确实就是source (code)!

    就是html页面的source code

    再仔细看sphinx的文档

    发现这个东西可以将纯文本文件的文档转换成很好看的html

    而且有table of contents什么的

    类似于wiki

    恩,要的就是这个!

    其实之前还研究了一下DocBook

    开始还觉得这个很有前途

    可是后来跟sphinx一对比,觉得DocBook就太恐怖了

    纯写xml!

    sphinx用的是reStructuredText

    不过功能更加强大

    开始以为这个只能用于python

    后来发觉不局限于程序语言

    有了这个东西,写文档就会轻松的多了

    就相当于写wiki,方便,快捷

    本来考虑过用Google code 上面的wiki

    但是总感觉不是很舒服

    插入图片什么的都相当不方便

    功能非常原始

    而这个的话,相当于把文档当成程序了

    功能很强大

    以前用wikidot,里面的内联功能非常实用

    而这个里面也可以轻松做到

    嗯。准备试一下了。

    主要感觉很多东西不好写在源代码里

    比如一个包,使用一个功能可能牵涉几个概念

    而且纯粹源代码里的注释用于写文档的功能也不强

    写文档可以有助于在抽象层面固化设计

    同样的功能,代码会经常变化。

  • c++

    2009-02-11

    虽然很早就知道任何的问题都应该用最合适的工具来解决

    但是总是不知不觉就陷入一种工具,比如c++

    而不习惯尝试另外一种,比如matlab

    所以自己其实一直以来的效率都很低

    昨天尝试用了一下matlab

    其实主要是因为下载了一个matlab的类库

    然后很快就得到一个结果

    其实也找到了一些c++的类库

    但是

    终于意识到c++的问题所在

    c++是一个严重精神分裂的世界

    很多很多,很多很多的事情,都缺乏一个统一的类库,或者标准

    比如文件系统

    还有字符串系统

    甚至是类型系统

    对于其他应用性的东西更是如此

    比如,缺乏一个好的标准的矩阵库

    结果之一就是几乎每个成熟的类库都会定义自己的一套基础类库

    而这个结果就是类库之间基本上无法重用

    也就是精神分裂

    而这个问题其他的语言解决的好得多

    比如java,比如python,ruby,以及matlab

    这些语言的标准库,以及应用库都蓬勃的发展

    而且库的使用都非常简单

    而c++呢,虽然已经有这么多年的历史,但是连最基本的文件系统都没有标准的类库

    虽然boost在推进这些

    但是进度太慢,而且似乎自己本身也存在问题

    总之呢,以后对于任何的问题,都得先想想能不能不用c++来做?

    再说说动态语言的优势

    比如实时的结果反馈

    这对于要try各种各样idea的问题来说非常有效

    matlab的visualize做的非常不错

    如果用c++来写,还得专门新建项目,编译,然后运行,代价非常之高

    而且c++也缺乏好的visualize的类库,有一些,也不好重用,而且复杂。原因也就是因为类型系统的冲突

     

  • Factory and Configuration are better than composition in program

    For instance, GUI design

    create button objects may be ok for simple gui, but configuration scripts are better than program code for complex task

    The same as other domain tasks which need many parameters to config

    configuration is a more abstract, has much less implementation details, and is a kind of domain language

     

  • deep thinking

    2009-02-01

    good design need deep thinking

    rush coding usually lead to bad design

    refactoring still need deep thinking, since good design need deep thinking

    documentation is better for design than code

    since deep thinking need writing/sketching

    natural language is better than program language for design

    and pseudo code is better than program code for design

    a good program code should close to natural language code

    but it's hard to create good program code from scratch

    since program code is strict, need verification, filled with language details, fixed grammars. all of those distract design process

    for a complex problem, we need first extract the most abstract core problem

    then solve the problem in documents first

    a document includes the derivations, the principles, the trade-offs, the options

    a document is essential for understanding the problem

    while the code is simply one the final solution to the problem, has nothing to do with the understanding of the problem

    writing is a thinking process

    coding is an implementation of thinking

     

  • 这个链接有一些:

    http://www.cs.ubc.ca/spider/lowe/vision.html

    有几个公司感觉挺牛:

    http://www.pvi.tv/pvi/index.asp

    做augmental reality的,没想到这么有前(钱)途

    http://www.mova.com/

    用很多的相机来计算人脸的三维模型

    http://www.seegrid.com/tech_howitworks.php

    这个哥们的论文很早看到过,没想到开公司了。不过觉得3d grid map 似乎太浪费了

    唉,自己的东西搞了半天还没搞出来

    其他大部分都是inspection的公司,检测机器零件或者样品封装

    另外有一些做tracking的公司

    做三维建模的公司不多

    感觉还是augmental reality最有前途,核心技术是camera tracking。其实那个公司做的也许更简单,只是pan/tilt/zoom的分析。

  • 裁员

    2009-01-23

    本来以为微软会是最后一块乐土,看来也不是了

    本来以为学校会是避风港,现在也不是了

    校长已经连续发了好几封信,都是关于削减开支的

    今后两年都要削减几亿美金的开支

    相当于什么呢?

    关闭一两个校区

    裁掉几百个职位

    奖学金变得更少,或者几乎没有

    老婆今天去系里,说系里好些人都收到被裁通知,有一个人干了19年多,本来都要退休了,也不能幸免于难

    我们系呢,其实上学期就有动作,ta都只有一半的钱,基本连房租都不够

    而这个学期呢,身边已经有几个人连ta都没拿到

    yichuan说他老板让他们以后自己想办法搞钱

    今天又听到消息,弗吉尼亚理工又发生惨案,一个中国学生残忍杀害另一个中国女留学生,据说头都被切下

    在intel工作了很多年的jun说想以后回国

    上周末去他家party,房子很大,电视很多,还有台球桌,觉得他们很幸福

    他说在这儿boring了,已经在美国工作了十几年

    他说以前觉得美国生活稳定,现在看来其实也不是了

     

  • http://blog.wired.com/business/2009/01/twitter-yahoo-b.html

    http://zooie.wordpress.com/2009/01/15/twitter-boss-real-time-search/

    据说源代码不超过100行

  • http://ces.cnet.com/8301-19167_1-10142957-100.html

    那以后是不是3D的相机和摄像机也越来越多呢?

     

  • USB3.0

    2009-01-18

    http://news.cnet.com/8301-11386_3-10141810-76.html

    理论速度上限是5Gbps

    什么概念呢?

    就是一部高清电影一秒钟就可以复制完毕

     

  • degeneracy

    2009-01-14

    理论看起来都很美好,但是一到实际总是出问题

    一个主要原因就是degeneracy,另一个是outliers

    很多问题归结为一个简单的问题

    比如,一堆的点,拟合一条直线

    经典方法是最小二乘

    但是如果有很多outliers怎么办?经典算法是ransac

    但是如果有degeneracy,rasac也解决不了,而且会出问题

    比如,百分之九十的点都很近

    ransac就会直接出问题

    一个简单的想法是聚类,但是有没有更加理论性的方法呢?

    如何判断degeneracy?如何衡量degeneracy?如何解决degenearcy?如何衡量uncertainty? 

  • 乱七八糟

    2009-01-14

    感觉今天又重新开始了

    从老婆生孩子,做完月子,就一直忙碌,几乎每个周末都往学校跑,每周都是deadline,每周都有很大压力。人太忙碌,以至于过去半年找不到什么可以回忆的地方。唯一的见证就是宝宝飞速的成长。从开始的小不点,到现在的大小不点。从开始的混沌,到现在的有意识。感觉人越忙碌,就越是空虚。而现在这个年景,无论是学校还是公司,没有人不忙碌。不敢不忙碌。大家都说,忙碌才是好事。其实,主要目的也就是混口饭吃。讽刺的是,社会越来越进步,物品越来越丰富,生产力越来越高,但是人越来越为生计发愁,压力越来越大。昨天看京华烟云,感觉里面的丫鬟似乎都是不愁吃不愁穿不愁住。也许是因为压力来自竞争,而知识越进步,竞争的水准也就越高。以前大家主要是体力活儿的竞争,而现在大家是脑力活儿的竞争。也许社会也就是靠竞争而发展。

    回头再反思自己的research。感觉就是横冲直撞了三个月。撞到一个南墙,发现路不通,回头,改走另外一条路。再撞到南墙,再不通。再回头。也许经验就是这么积累的吧。等到大部分的路都尝试了,才会发现一条好的路。不过经验教训得好好总结一下。 

  • 到底又放弃了

    2009-01-13

    唉。真实数据的试验效果总是不好。昨天下午才把模拟数据的实验做出来。效果不错。不过真实数据总有这样那样的错误和偏差。看来算法本身仍然不够健壮。或者,数据的预处理做的不够好。

    而且,处理实际数据的每个环节都涉及到误差和错误处理问题。

    每一个环节出问题都可能会对下一个环节造成影响。

    对于video来说,误差还会持续的积累。如何能够纠正误差呢?

    其实中间已经不断的在调整算法,不断的简化问题。

    目前的这个算法也就是上周末才开始实现的。

    当然也有了些积累。

    也许积累的还不够。

    等处理了所有的问题,算法才真正的有效。 

    看别人的方法。其实也用了很多的tricks。而且有些实验也很简单。

     

  • 虚拟世界

    2009-01-10

    世界的镜子 http://tech.sina.com.cn/i/2009-01-08/12372730310.shtml

    脑力工作基本上都是信息处理

    大部分工作都是脑力工作

    信息都在电脑,手机,网络里

    任何设备都是由程序来控制

    信息越多,获取更容易,人吸取的信息就越狭隘,人也就变得越偏执

    人也就更容易被大众潮流所导向

     

  • 3D

    2009-01-05

    http://tech.sina.com.cn/e/2009-01-04/19212715697.shtml

    James Cameron on the Deep Impact of 3D Movies

    http://www.studiodaily.com/filmandvideo/people/visions/6423.html 

    Three different 3D processes were discussed. There’s the Cameron way, which involves shooting a live-action feature with a 3D camera rig (generally two Sony F950s bound together in a complicated assembly); there’s the Chicken Little/Polar Express method, which involves adding 3D to a previously devised CG-animated world (simply by rendering out a second camera view); and there’s the In-Three way, which has that company “dimensionalizing” existing films. (A demo reel from the first Star Wars movie was a highly compelling demonstration of that company’s technology.) 

  • 乱七八糟

    2009-01-04

    Android Netbooks

    还有免费的ubuntu,等等

    感觉操作系统慢慢的变成了日用品

    除了游戏,编程,图像处理,office需要windows以外,其他大部分的事情基本上都是在浏览器上

    其实现在简单的图像和视频处理都可以在浏览器里做了

    chrome的目的也就是让操作系统变成日用品

    那么是否都可以不用windows了?当然不行。

    操作系统替换为浏览器,而浏览器是生存在互联网上的。也就是说,操作系统变成日用品的前提是互联网基础设施的完善

    也就是说,随时随地都可以告诉上网,最好还是无线

    这个过程不会太久,也许五年,或者最多十年,而现在已经相当一部分的实现了

    总之,大家其实生活在网上

    也就是说,软件应用要完全变成网络应用

    而构建网络应用仍然需要服务器和带宽成本

    有服务器和带宽的需求就自然会有公司出来满足这些需求

    比如Google, amazon。microsoft显然也正在准备

    中国也有公司加入进来。比如阿里巴巴和百度。

    底层的基础设施也许最后只能归入很少的几家大公司。

    而当这一部分竞争加剧,也会变成利润不多的日用品。

    只有垄断的地方才会有高利润

    比如Google对搜索引擎广告的垄断

    一方面固然是技术的进步,它比传统广告更节省成本,更有效,而另一方面,则是搜索引擎本身的垄断地位

    在互联网信息领域,资源是用户的点击(或者浏览时间)

    谁能够获取绝大部份用户的点击,谁就是垄断

    所以,这个领域最核心的竞争力是用户的体验,用户是否总能得到想要的东西,或者用户是否能沉溺于其中

    对于应用领域,有什么应用呢?

    网游,显然已经成功

    企业管理软件,完全迁移到互联网上仍然需要一定时间,但是已经有很多成功案例,比如saleforce

    做数据库的仍然可以通过这个赚钱

    聊天和社区,已经很成功

    办公。已经有很多公司在做这个,mail早就成功。不过word和powerpoint还需要浏览器和网络进一步的发展。最关键的问题就是图像的数据量大,而html也无法随意渲染页面。也许flash这些富客户端将来可以解决这些问题。到时候三维游戏也都可以做进来。 

    现在搞图形图像。跟这些似乎都没啥关系。前几天看到一个国内的杰图公司,做三维全景的。和google街景一样。技术倒是不难。不过仍然没想到国内也有做这方面的,好像做的还不错。应用也很广泛。Google的车还没有走到中国。在这段时间,城市吧可以尽快发展。目前感觉跟google的街景还有些差距,主要是图像质量问题,亮度不够均匀,分辨率也不高。这个公司的定位是虚拟现实。跟我的背景非常match。本来还挺有想法。后来搜到工资只有6000,还不如本科毕业的时候。无论如何,发现自己现在做的东西还是有很大应用背景。比如给房地产商,旅馆,旅游景点做宣传。既然涉及到图像,也就涉及到图像的质量。图像质量一个是分辨率,一个是清晰度,将来的方向则是hdr。hdr给人带来的视觉冲击回事传统图像无法比拟的。另一方面,对于广告来说,目前基本上都是在页面里面显示。其实也许更好的方式是做到图片里面。而这需要三维重建的技术。对于图像里的面,只要知道大致的深度和平面的方向,就可以往一堆图像里贴同一幅图,比如广告。试想,我们的街道上有多少广告?那么,街景里也就可以贴多少广告!无论是Google的虚拟地球,还是microsoft的virtual earth,他们应该都有这方面的野心。而问题的关键之一是三维的模型。三维模型目前来说还根本不够实用。因为很多技术问题目前不好解决。而且三维模型相对来说也很复杂。ibm的紫禁城(超越时空),就花了三年三百万。不过,街景可以说是目前比较完美的替代方案。而贴广告应该也不是很难。再说旅游吧,大家一般会先查找信息,一般来说,这些信息都是文字的,或者地图,或者简单的几张图片。而一旦有了高密度的三维全景,配以Gps三维信息,那么,用户体验会完全不一样。不仅如此,也许到某个程度,我们可以开个完全虚拟的旅游景点场馆,用几个projectors,把图像照射到四周的幕布上,让用户感觉身临其境一样。另一方面,对于当地的旅游者,他们可以用手机来实时查看路线,以及会遇到的风景。手机,旅游资讯查询是很大的应用。为啥我两年前看demo时没想到呢?

    再说另一方面,三维建模。这些得结合专业的建模工具才行。而且得需要专业的建模人士。即使是sketchup,也有不小的学习曲线。microsoft的photosync是另一个方式,原理也是三维重建。不过不知道稳定度怎么样。而且,会有信息冗余,不一致等等的问题。专业的三维全景应该仍然是最实用的虚拟现实方案。

    机器人。目前在搞这个。但是结果还不是很好。明天就是跟老板说的deadline。哎。模拟数据效果不错,但是实际的不行。准备再改进算法。这个东西本来非常看好,但突然觉得应用也许到十年后才出现价值。目前GPS系统已经很完善。local的自动建模应该有用,可以用来壁障。不过机器人本身的应用还需要很多时间。目前来说也就军方有成功的应用。不过成本非常高昂。其实任务也很简单。感觉将来应该是mini机器人会有前途,摄像头,mini pc,加上几个轮子,就可以成为一个机器人。可以用于探测,侦查。自主性则需要人工智能的进展。目前只能作为工具。感觉自动的规划路径和壁障仍然很有前途。比如让他从一个城市到另外一个城市。用户不可能总是实时的操作。这需要高级的规则和任务设置。这个东西对盲人也许会有帮助。