1/31/2007
《House》也是我很喜欢的美剧之一,昨天躺在床上用热水敷着我的受伤的腰,看了好几集。看了最多的感触就是生命的脆弱。所以一定要珍惜美好时光。好好努力好好学习。
1/30/2007
雪山之巅
蓝天雪山
少了一个BoBo
嘿嘿
个人照,山顶那叫一个冷啊。
感觉狂白领的小芳
以及她老公
Valmorel
彩虹
两个太阳,两个彩虹
雪山顶上的BBQ
生化人
冰镇饮料
蓝道出发啦。
狂有生活气息的婚纱照
杀气,我感到了杀气
装可爱的小滕
这个表情可是我导演出来的哦,不错吧。猜猜我说啥了。
1/29/2007
觉得歌词写的很好,很符合自己的人生观。记得以前我Spaces也发过类似的观点。不找了。这首歌目前我还没下到,但是在youtube上找到了MV。
歌词不知道是谁翻译的。
Savoir aimer / 懂得去爱
Sans rien attendre en retour, / 不求任何回报,
Ni égard, ni grand amour, / 不求被尊重,不求伟大的爱情,
Pas même l'espoir d'être aimé, / 甚至没有被爱的渴望。
{Refrain:}
Mais savoir donner, / 要懂得给予,
Donner sans reprendre, / 不求回馈的给予,
Ne rien faire qu'apprendre / 要能学习,
Apprendre à aimer, / 学习去爱人,
Aimer sans attendre, / 不抱任何期待地爱。
Aimer à tout prendre, / 承受一切地爱,
Apprendre à sourire, / 学会微笑,
Rien que pour le geste, / 只为了一个手势,
Sans vouloir le reste / 不为其它理由,
Et apprendre à Vivre / 学会生存,
Et s'en aller. / 而后继续人生。
{Refrain}
Savoir attendre, / 懂得等待,
Goûter à ce plein bonheur / 品尝这饱满的幸福滋味,
Qu'on vous donne comme par erreur, / 因为每一段偶然的遭遇,
Tant on ne l'attendait plus. / 日后很难期待它再发生。
Se voir y croire 试着去信任,
pour tromper la peur du vide / 为了逃避对空虚的恐惧,
Ancrée comme autant de rides / 我们抛下太多的锚绳,
Qui ternissent les miroirs / 搅乱了我们的湖水般的心镜。
{重复}
Savoir souffrir / 懂得承受
En silence, sans murmure, / 默默地承受,没有抱怨
Ni défense ni armure / 不去防备不去武装
Souffrir à vouloir mourir / 甚至最终牺牲,
Et se relever / 而后重新站起,
Comme on renaît de ses cendres, / 有如死而复生,
Avec tant d'amour à revendre / 带着满蓄的爱的能量,
Qu'on tire un trait sur le passé. / 摆脱过去的羁绊。
{重复}
Apprendre à rêver / 学会去做梦,
À rêver pour deux, / 为了两个人而做梦,
Rien qu'en fermant les yeux, / 只要闭上双眼,
Et savoir donner / 懂得给予,
Donner sans rature / 真诚地给予,
Ni demi-mesure / 没有保留,
Apprendre à rester. / 学会守候,
Vouloir jusqu'au bout / 直到生命的尽头。
Rester malgré tout, / 不顾一切地守候,
Apprendre à aimer, / 学会爱人,
Et s'en aller, / 而后继续人生,
Et s'en aller... / 继续人生。
1/19/2007
这次决定滑Snowboard了。Snowboard和Ski属于完全不同的两个概念,这次看来又要从头开始。从零开始。先来介绍一下Snowboard的背景知识:
单板滑雪的渊源是夏季的单板运动——冲浪,而不是冬季的双板滑雪。单板滑雪直接脱胎于雪中冲浪,20世纪60年代中期,美国的沃伦·珀普(Warren Poppen)发明了雪上冲浪。而雪上冲浪的狂热分子杰克·波顿(Jake Burton)和职业冲浪手汤姆·希姆斯(Tom Sims)则是现代单板滑雪运动的两位开山鼻祖。
具体感受等我回来再写,接下去几天我就不更新Spaces了。我会注意安全的。别担心我。
1/18/2007
上次滑雪的视频的配乐相当的激动人心。昨天小滕突然蹦了出来,给我发了一个网页。我这才知道原来这段音乐是Era的The mass。以前从来没听过Era的任何歌曲。仔细看了Era的介绍:
Era,英文原意为“时代、世纪”,是一个风格与Gregorian(格林高利合唱团)接近的音乐团体,其灵魂人物是法国音乐家Eric Levi。关于Eric Levi,我们所知的确实不多,甚至也只在Era的作品中见过他的名字。而且他也不属于高产型的音乐家。Era至今为止仅发行过3张专辑,分别是1998 年的《Era》、2001年的《EraⅡ》以及2003年刚刚发行的《The Mass》。发行数量并不多,但都是颇受欢迎的作品。Era系列几张作品获得的成功反响,为他与日俱增的名气奠定了优厚的基础。
这首The Mass事实上属于newage。在iTunes显示的是celtic。以前从来不知道Celtic是什么类型的音乐。查了查才知道celtic是什么:
提起“凯尔特”(Celtic,也有人翻译为“克尔特”或“塞尔特”)音乐,很多人都直觉的把它与爱尔兰划上等号,事实上,它并不是爱尔兰人的专利,只不过因为这个领域最成功的许多艺人或团体都往往来自爱尔兰。其实,爱尔兰只是凯尔特民族活跃的地方之一。想要认识这种音乐,我们必须对“凯尔特”这个名词先有所认识。凯尔特人,是欧洲最古老的民族之一,大约在五千年前就兴起了,最早主要生活在阿尔卑斯山以北,后来分布范围日益扩大,从不列颠群岛到巴尔干半岛都有,而且往往居于统治者的地位,希腊人所说的“克尔图人”和罗马人所说的“高卢人”,事实上就是凯尔特人。由于在文化上相当的强势,欧洲各国都深受他们的影响,可惜由于人口过剩、社会关系紧张、以及扩展版图太过激进,从西元前二世纪开始,逐渐由盛转衰,受到罗马帝国与日耳曼部落等的夹击之后,失去了统治者的优势,连他们的文化也受到罗马帝国的同化,只有在爱尔兰和不列颠还保存得比较完整。
凯尔特人体格高大、肤色白晰、强壮、尚武、爱好冒险,同时相当迷信,有着许多充满幻想的古老传奇,因此从昔日的“亚瑟王与圆桌武士”,到近年来远近驰名的“哈利波特” 与“魔戒”,都充满着非常“凯尔特”的神秘传奇色彩。另外,由于在爱尔兰与苏格兰等这些他们目前主要的生活空间,经济资源比较匮乏,加上在政治方面受到了不少打压,所以我们又可以发觉,在浪漫与豪放的同时,他们的文化,特别是在音乐方面,也往往呈现着伤感的悲情色彩。而为了追求生存的机会,他们大量往“海外”移民,于是从美国、加拿大、到澳洲,凯尔特文化也随着那些移民的脚步,逐渐的流传开来。简单的了解了他们的历史背景之后,我们也就不难理解凯尔特音乐里面各种特殊的情感因素了。
坚决鄙视那些只看到CD封皮就说是歌特风格的人!这个专辑里有不少动听的歌曲。当然The Mass的MTV也相当的酷。The Mass歌曲节奏感很强,听着The mass,闭上眼睛脑海中浮现出The Lord of the Ring的最后一仗。甘道夫一身雪白,举着魔杖放射着万丈光芒,从远处赶来救援的场面。这个MTV情节也很类似。
另外我spaces里提到的mp3都可以在我的服务器上找到,我的服务器是mp3.zhouc.net,需要登录,用户名是beloved。密码是我的名字的拼音。目录是以演唱者->专辑名->歌曲这样的结构组织的,应该很容易找到想要的歌曲。
加上这张专辑,豆瓣上我正在听的专辑刚好达到100张。发图庆祝一下。

来写一下我购物买的东西吧,这次打折我比较控制自己的消费欲望。我买了两件衬衣,一件是白色的长袖,一件是蓝色的短袖,一共35欧。还买一双Nike+的跑步鞋子。买一件Nike的外套20欧。买了一双滑雪用的袜子12欧。买了一件滑雪服80欧(不得不买啊,原来的太大了)。

1/17/2007
现在iTunes上提供这个Keynote下载了,喜欢苹果的人可一定要去看看。我觉得这也是一个相当成功的presentation。把握节奏恰到好处。一个好的Presentation就如同一部电影,演讲者带着你步步深入,谜底一个一个揭开,不禁为他喝彩。
Macworld Keynote Address
最近迷上了PS2版的Contra,也就是魂斗罗。这几天晚上下班后就往周小来家跑。游戏的水平越来越高,昨天晚上跟周小来两人配合居然还打出了A级的评价。每次小滕看到我们在打这个游戏就不停的说你们不是打过了吗?游戏的乐趣也正在于此,红白机上的魂斗罗我又玩过多少次了呢?不知道,反正最后能连着通关7次不死人的。突然觉得我们两个大男人就跟孩子一样。哈,生活有时候这样放松一下不也挺好吗?
BTW: 刚才有一篇帖子是我不小心发出来的,是很久以前写的,看见的也就看了。其实我的spaces里的帖子分为两类,一种是发布出来,另外一种是自己写了做个心情的纪录而已。刚才我在大规模的给所有的日志分类。所以不小心把几个月前的一篇隐藏blog发了出来。所以现在删除了。
滑雪还有三天,我简直已经没有心情认真工作了。很浮躁。就如同《South Park S10E12》里的Carteman在等待Nintendo Wii的感觉一般。每天早上都在游戏机店门口徘徊,想着离发售还有3个礼拜。夜夜失眠。看这一集尤其搞笑,特别让我联想起,渴望买PS2的周小来。
1/16/2007
复杂的解决方案很好,实际上简单的办法往往比复杂的方法效率要高很多。美国NASA花费了几百万美元研究可在无重力环境下使用的圆珠笔,而苏联人则简单的使用铅笔。还有我曾经提到的空盒子问题。日本一家生产肥皂的公司发现他们流水线上生产出来的产品有空盒子,为了提高产品质量,避免缺陷,他们请了很多工程师设计了一个新方案,花巨资改进了流水线。保证每个盒子在出厂前经过专门的设备检查,确保所有的盒子里装有肥皂。日本人参观中国一家肥皂公司时却惊讶的发现,中国人处理这个问题的方法却是如此的简单——放一台电风扇对着流水线吹,如果盒子是空就被风从流水线上吹走。简单之美。
在计算机中也是如此,复杂的算法带来大量运算,复杂并不能很好的解决问题。反而一些看起来异常简单的方法却能奏效。例如,同义词在计算机里的处理。计算机无法理解人类语言,只能通过逻辑去推测。同一个词如果有多个意思(例如:bush,在一些文章里可能是指美国总统布什,也有可能在另外一些文章里就是杂草),对人而言,理解这个词可以通过上下文语境获取语义。而计算机处理则要痛苦的多,通常的模型都非常复杂。这里要提的是Yarowsky提出的算法。他很好的解决了这个多义性问题。这个想法却异常简单。它的理论基础是,通过对上下文里用词的分析来判断该文章的语义。例如在使用到bush这个单词的文章里去检索各种单词的使用情况,如果发现该文是一篇涉及政治方面的文章,那么这里的Bush有相当大的概率是指美国总统。这个方法简单,效果却惊人的好。至今为止还没有有能超越它的算法。有趣的一点是,或许Yarowsky是因为非常急着想获得博士学位,才想出的这个办法。也就是因为这个算法Yarowsky三年就拿到了博士学位!
上一次在关于wiki那篇文章里faye提出的繁体wiki比简体wiki要好。事实上这是错误的。当前wiki的中文繁体与简体之间转换是自动的。转换的方法一般都是进行编码转换,再加上习惯用语的一些修正。不过这里要说的不是中文繁体和简体之间的转换。说的是另外一种在文法分析里一个经典的简单算法《基于变换规则的机器学习方法 transformation rule based machine learning》。该方法可以用在句子的文法分析上,比如分析句子中每个词的词性,动词抑或名词。该方法非常简单,效果却比很多复杂模型还要好。比如:我们用该方法将拼音转换成汉字,操作如下:
- 将所有的拼音转换成中文,把每个拼音对应最常用的汉字找出来。由于汉字有很多同音字,比如:“可以”和“课椅”。
- 根据上下文从所有组成词的可能性里选择可能性最大。就跟上一个例子所说的是一样的道理,可以采用词频来判断上下文内容,然后决定使用那个词。
- 从头到尾根据规则将有用的词条保留,无用的词条删除。继续重复步骤2和3,直到完成。
当然简单而却又高效的模型是我们所期望的,而却不是那么容易能获得简单的方法,事实上人们往往要走很多复杂的弯路才能抵达简单。美丽的简单将是我们永远追求的目标。
1/15/2007
页面访问数超20000了,拍个照片,存个底。继续努力,向3万前进。

1/14/2007
今天早上起来发现阳光特别好,心情于是也灿烂了起来。喝了杯咖啡。痛下决心,决定进行大扫除工作。把房间彻底的打扫了一遍,把所有的家具和电器都擦的干干净净,甚至把床底下也认真的拖了一遍。冬天过去了,又把衣服换了换季。周末也总算做了点正事。打扫完卫生已经是下午2点了。这么好的天气不出去运动简直对不起法国的阳光。但在跑步和滑轮之间犹豫了,跑步相对来说比较单调,而滑轮则可以几个人一起,还可以一起聊天,于是选择了滑轮。更何况我们小滕同学昨天还新买了滑轮鞋,于是还是选择了去滑轮。这里还是要表扬一下小滕同学,进步很快,当然新鞋子功劳也不小。今天我们还看到一小段彩虹fragment of rainbow。
另外我在Fon上申请的免费的无线路由器也已经到了。俺也是Fon一员了,上照片。





今天的天气出奇的好,最高气温居然达到了10度。这样的三九天百年一遇。今年下雪的期望彻底被打破了。数了数这是9年来我过的第一个无雪之冬。我并不喜欢雪。特别是北京的雪。下雪时北京就变成一个大停车场。记得几年前,北京突然遭遇了一场意外的早雪。整个城市地面交通彻底的陷入瘫痪。最悲惨的是我姐。她和我姐夫被堵在离家几公里的路上,开了五六个小时才回到家。突然有点想念北京的生活。北京的小吃,北京人的热情。喜欢每天工作完后在回家的路上买份晚报,饭后看会大大小小的新闻。今年夏天我要回去了。这或许是滑雪后最值得期待的一件事了。
1/13/2007
看了《The pursuit of happyness》,一部砺志片,一个典型的美国梦。Will Smith的角色是一个贫困的销售员,没有什么资本,最高的学历是高中。生活很艰难,她的妻子也因为无法忍受生活艰难离开了他和他的孩子。贫困的生活,又因为一系列不辛的事情,导致他账户上只有26美元,被人赶出旅馆,无处可住的他只好带着孩子住在地铁的厕所里,每天都要在5点去排队领救济。虽然从一开始就知道他最后会成功,但是依然被这样穷困的生活所感动。当然Will Smith没有放弃,他也没什么可以失去,唯一能失去的就是希望。他没有放弃,抓住一切机会,最后他成功了。想起Eninem在Lose yourself里的歌词:
Look, if you had one shot, or one opportunity
To seize everything you ever wanted-One moment
Would you capture it or just let it slip?
整部片子最让我影像深刻的是在他带着孩子打篮球的时候告诉他孩子。Don't let anyone told you, you can't, even me.(大概是这样,没字幕)。在别人觉得你可以做到的时候把事情做好,并没什么。难能可贵的是所有的人告诉你你不可能的时候,你努力的去做,并且很好的做到不可能的事情。
我喜欢的影片似乎都离不开一个关键词:persistance。这个词也是最难做到的。很多时候想放弃,放弃其实很容易,任何人任何时候都做的到。没有希望,看不到希望的时候你也能坚持不放弃吗?如果可以,你会成功的。I will capture it.
1/12/2007
科普啦,科普啦。今天来说说计算机上的文档管理。写过论文的同学都知道在写一篇文章的时候必须要提供三个以上的Keyword。当然你会说这是检索文章所必须的。可是事实上不是这样的,随着计算机技术的进步,Keyword实际上已经失去他原来的实际意义,现在的存在更多只是因为习惯或者作为一个阅读参考。为什么会这样呢?很简单,原来的计算机太慢了!硬盘太贵了。没办法给整篇文章建立索引。那原来计算机系统是怎么做的呢?
如果我们要检索一篇文章,我们必须提供多个搜索关键词。比如为了检索这篇Blog,我们提供“科普”,“搜索”作为关键词,我们想找出所有包含“科普”并且“搜索”的文章。我们输入“科普” AND “搜索”,计算机开始工作了,计算机当然不可能把每篇文章读一遍来判断是否文章包含这个词。这时候就要使用索引,索引是什么概念呢?比如我们来看看10篇文章的“科普”和“搜索”关键词的索引的建立:
- 文章 1 不存在“科普”关键词 不存在“搜索”关键词
- 文章 2 存在“科普”关键词 不存在“搜索”关键词
- 文章 3 不存在“科普”关键词 不存在“搜索”关键词
- 文章 4 存在“科普”关键词 不存在“搜索”关键词
- 文章 5 不存在“科普”关键词 不存在“搜索”关键词
- 文章 6 不存在“科普”关键词 存在“搜索”关键词
- 文章 7 不存在“科普”关键词 不存在“搜索”关键词
- 文章 8 存在“科普”关键词 不存在“搜索”关键词
- 文章 9 不存在“科普”关键词 存在“搜索”关键词
- 文章 10 存在“科普”关键词 不存在“搜索”关键词
如果以上的存在和不存在用计算机语言二进制1和0来表示,“科普”这个关键词的索引就是0101000101,而“搜索”关键词的索引就是 0000010010。那么我们如何找到包含“科普”关键字并包含“搜索”关键字的文章呢?那就是进行布尔运算。即使是很低级别的CPU一秒也可以进行几百万次的布尔运算。我们将两个索引取与。也就是当同一位置上都是1的时候值才为一。很遗憾,这个例子里没有能有同时为1的值,那也就是说我们找不到满足同时包含“科普”和“搜索”这两个关键字的文章。如何?简单吧。其实跟原来提到的“毒酒与老鼠”问题是一个思路。
那为何文章需要提供关键字呢?以前计算机硬盘太贵,我们不可能为文章里的每个字建立索引。只允许我们建立三个索引。所以就导致了关键字的存在。当然现在计算机硬件的价格已经大幅度下降。基本上所有的数据库都提供了全文索引的功能。比如google就为全世界上的所有网页都建立了全文索引。这里又涉及到如何将结果排序的问题,这其实是个数学问题,这里就不讨论了。
其实Web上文档搜索发展也经历了三个时期,一是结构化的目录管理,以Yahoo作为典型的代表。二是非结构化的搜索,比如Google。三是用户为中心的Tag标签,典型例子有Del.icio.us和Flickr。关于第一种和第二种例子已经在以前一篇科普里介绍过了。今天重点来说第三种文档管理方法 ——Tag。
Tag,Tag就是标签,如同关键字一样。Tag和关键字不同的是Tag是完全以用户为中心,对象并不局限于文档,可以是任何在互联网上的资源,如图片,音乐,电影等。
使用Tag标签的优点:
- 用户为中心,Keyword是文章作者自己选定的,而Tag则是用户可以自由选择词汇来定义资源,和原作者毫无关系,用户甚至可以使用毫无关联的词汇来定义一个资源。Tag直接反应用户想用的词汇以及语言。这么做的优点就是,使用的用户自己的分类管理系统,以个人为中心所建立的分类方法,自然更适合自己个人的实际情况,也更方便用户寻找资源。
- Tag的重复性,一个资源可以被多个Tag所定义,一个资源也可以存在于不同的Tag当中。这无疑是更加的符合现实情况。例如,我们在分类的时候有的文章很有可能是同时会属于两个类别,原来的分类管理办法却很难实现。这种重新性对发现新的相关资源无疑是很有帮助的。
- Tag的社会性:用户可以公开自己的Tag以及自己所收集的资源,而且具有同样知识背景的人对同一资源所使用的标签具有很大的类似性。通过对同一标签的他人使用可以很方便的找到相关的资源。
这其实就是今年的热门词汇分众分类Folksonomy。
在这里我举一个国内网站作为例子:豆瓣网。豆瓣网是中国web 2.0的一个典型代表。通过对豆瓣网的分析,我发现豆瓣网惊人的符合我们的模型——HyperTopic模型。首先豆瓣网将资源分为三种(图书、电影、音乐),相对应于Hypertopic模型中三种不同的Viewpoint。在不同的Viewpoint里用户可以给资源分配标签。可以对资源进行评价。可以对资源进行分类。豆瓣通过对同一资源的类似用户所选择的情况进行分析,自动给用户推荐新的资源。这是一种相当不错的方式,通过豆瓣我找到了很多我喜欢的音乐和电影。
事物都具有两面性,既然Tag有这么都的优点,那肯定也有缺点:
- 歧义性:同一个字或者词在每一个不同的人看来都有不同的含义,例如:“Apple”这个单词,在普通人看来无疑是一种水果的名字。但是对于一个计算机爱好者而言,他所代表的可能更多是计算机品牌,对于纽约市民而言呢?那一个词如果本身就具备有不同的含义,又如何保证他所代表的资源是同一类资源呢?
- 统一性:几个Tag实际上可能是同一事物,但是却因为不同的使用习惯导致不同的拼写。例如:“Web2.0"和"Web2"其实是同一标签。但是计算机却不可能能理解其中的区别。
对比一下Tag和原始的Directory结构,我们很容易发现他们之间的不同。
- Tag是二维的,而目录则是三维的结构。三维的目录结构可以表达不同的层次关系,而处于二维空间中的Tag则无法表达不同的Tag之间的相关性。
懒得写了,手指写疼了,就这样吧。
这篇Blog是去年写的,后来本来打算整理整理写成文章的,就没有在Spaces上保存。不过也有很多人看过了。现在实在是懒得去整理他写成文章了。就这样吧。发在这里就好了。转载的时候注明一下出处我就满足了。
我来简单通俗的讲讲我的研究课题吧。
我的研究课题是:社会语义网。这个课题涉及到两个方面,一个网络的社会性,另一个则是语义。
首先我们来看看WEB的发展,以及目前的状况。
WEB一开始仅仅只是一个简单的使用超文本的信息发布网络。比如一个公司可以在网络上建设自己公司的主页,提供一些自己公司产品的信息。这些信息是单向 的。也就是说是在最早的WEB中信息是由一些特殊的组织发布,而普通的用户只是象收看电视一样查阅信息。随着网络用户的不断增长,用户不只满足于获得某些 组织提供的信息,他们也想发布自己的信息,并希望能进行交互。这个时候我们通常概念中的WEB出现了。在这个时代获得巨大成功的网站有 Amazon.com, eBay.com等。也就是所谓的电子商务大行其道的时候。
当网络信息呈现数量级的增长后,在一个巨大的信 息海洋里寻找自己所需要的信息无疑是一件很艰巨的任务。第一代的搜索引擎出现了。其中一个著名的搜索引擎公司是Yahoo.com,Yahoo从传统的图 书馆管理中获得了灵感,于是请了一批图书馆专家对所有的网页开始分类。比如一个关于中国地理信息的网页就被放在了世界->亚洲->中国这个目 录下,如果用户想获得中国地理信息,用户可以按专家提供的分类目录去寻找。这似乎也很成功。Yahoo成了最大的黑马。但是同时这也产生了一个问题,专家所提供的分类办法真的是最合理的吗?例如对有争议的钓鱼岛的网页是存放在中国这个目录下合适还是日本呢(仅仅只是举例,大家不要激动)?专家的观点未必就能代表所有人的想法。
这时Google出现了。Google说好吧,既然怎么分类都无法符合所有人的需要,那我就不对网页分类了。不管你想要什么,只要你输入,我就把所有包 含你输入文本的网页全显示出来给你。当然Google的后台还提供了一些算法,这些算法通过分析一个页面被别的页面引用的次数来决定那些页面对于用户是最 有用的。Google的想法很简单,但是却很适用。
这就是我最喜欢的一个KISS理论“Keep It Simple and Stupid(尽可能的简单和愚蠢吧)"。
在这里应该再说说Del.icio.us相关的内容。
再来说说当前很热门的概念Web 2.0(现在这个居然被Tim O'Reilly注册成商标了)。所谓的第二代WEB。第二代和第一代其实并没有很明显的区别。没有任何明确的标准来区分Web和Web 2.0。那么 Web 2.0是一个什么概念呢? Web 2.0最主要是具备了两个特征:一、社会性。二、新技术。先来说说什么是社会性。在我们日常的现实生活中我们处于一个社会中,我们都是参与者,我们有家 庭,有朋友,有同事等等。在第一代的WEB中我们显然不是一个网络的参与者,我们扮演的更多是上帝的角色,我们仅仅观察,浏览信息。在 Web 2.0中用户实际的参与到网络的建设当中来,我们可以拥有我们自己的个人空间,我们可以在Blog上发表文章,可以用Podcast建立自己的广播,可以 通过上传视频来分享自己的生活。重要的是我们把现实生活中的社会关系搬到了网络上,例如在一个著名的Web 2.0网站 flickr.com(在线相册)上,我们可以给用户分类,家庭、朋友、其他等。我们在上传照片的时候就可以指定照片的共享范围。或许我们有一些照片是仅 仅给我们的家人看的,我们就可以指定照片仅提供给家人浏览。这只是一个比较简单的社会性的特征。还有一些Web 2.0的网站,如豆瓣网,用户可以通过自己喜欢的书、电影、音乐来结识有相同爱好的朋友。这些就是社会性,Web 2.0让我们在网络上成为了一个真正的参与者。
再来说说Web 2.0的另外一个特征,新技术。一直以来Web界面的友好性都是我们所关心的重要问题。由于技术的限制使得Web无法象传统的桌面软件那么强大。比如受早 期的网络速度的影响用户和服务器的交互被设计成了非持续的,也就是说我们每对页面进行一次操作我们都必须重新刷新一次页面。作为Web的用户我们都很清 楚,刷新就意味着等待。如果一个网站老让你等待,那你对他的印象肯定好不到那里去。当然随着WEB的发展,我们的技术也在进步,通过使用一些新的技术,例 如:AJAX,我们可以做到不刷新页面,不让用户等待的情况下获取新的信息,实现和服务器之间的数据交互。这使得WEB变得更加的友好,亲切。比较著名的 例子有:Gmail.com, maps.google.com, calendar.google.com,www.flickr.com等。
说完当前的WEB状况,让我们来展望一下未来。未来当然是不确定的,但是我们也有我们的发展目标。一直以来Web所关注的问题都是人机之间的交互,也就 是说目前Web所提供的信息大部分都是提供给人们浏览,而不是让计算机操作的。这么一来问题就出现了。人的能力毕竟是有限的,无法象机器一样长时间高效率 的工作,如果要靠人对信息进行过滤找到所需要的信息,那效率是很低下的。虽然有在前面提到的Google这样的搜索引擎来帮助我们,但是Google毕竟 不能准确的理解我们的问题。例如,我们要找一篇是周超所写的文章,那Google会怎么去做呢?Google会把所有包含“周超”这两个中文字的网页全检 索出来提供给我。可是这不是我们所想要的。因为在检索结果中可能有很多不是我需要的信息,例如:“本周超值手机....”这样的页面(当然这个例子比较极 端,这个是因为Google对中文的分词做的不好),与此同时Google的检索结果却很有可能忽略了很多我想要的信息,例如,我发表的英文文章我的署名 很有可能就是"ZHOU Chao"或者"Chao ZHOU",这些信息Google就会忽略掉。之所以会出现这样的情况,那是因为搜索引擎无法理解数据的含义,他所完成的工作仅仅是对字符串的比对(当然 也使用了一些算法来提供信息的命中率),Google并不知道"周超"和"Chao ZHOU", "ZHOU Chao"是同一个人。
为什么会出现这样的情况呢?原因就是对数据缺乏良好的定义。不同的组织所发布的信息没有对数据进行统一标准的定义。这个问题就好像是:一个中国人和一个 法国人在聊天,他们都各自说自己的语言,那他们当然无法互相理解。为了能让他们互相理解我们所需要做的就是对中国人和法国人说的话的内容进行一个统一的定 义。去除一切不需要的信息,保留一句话的含义(也就是本体)。例如:中国人说“我爱你”,法国人说“Je t'aime”。这两句话表达的意思是一致的,在进行统一定义之前,中国人和法国人当然是都无法互相理解的。我爱你这句话的本体是什么呢?本体就是“A (我)向B(你)进行一个C动作(示爱)”。好,语义网要做的就是把这个本体使用某个方法表示出来,让中国人和法国人互相理解。在这个例子里我们可以使用 一种双方都明白的中间语言,例如:英语。再来看看它是怎么工作的。中国人说"I love you",法国人说"I love you too"。Yes,两个痛苦的恋人终于互相明白了。这就是语义网要做的事情,为计算机之间(中国人,法国人)找到一种通用的语言(英语),让计算机互相理解,让计算机协同工作,把人类解放出来。
这还不是我确切的课题,我课题不仅仅是让计算机之间能互相理解协同工作,同时还要增加一个特征,社会性。
打字打累了。待续吧...
1/11/2007
《窃听风暴》说的是在社会主义高压监视下,一个特工和一个作家的故事。前半部分没什么亮点。后半部分却充分的表达了作者内心深处那个啥。人之初,性本善,我相信所有人都是善良的,至少有善良的部分。即使在动荡不安的时代也有善良的人,也有愿意为自己的良知放弃一切的人。在西方世界看来,社会主义总是和专制联系在一起。虽然社会主义有他的缺点。但是我相信这个制度还是有其优越性的。不过这里不谈政治,只谈人性。《窃听风暴》这个名字翻译的有点问题,一开始我还以为是大片,有很多火爆场面。看完才知道其实是一部对人性探讨的影片,英文名是The lives of others,这个名字更确切一点。这里我不想涉及剧情。估计这部片今年有希望被奥斯卡提名。
1/10/2007
Spaces页面点击率已经突破19500次了,下个周末的时候应该能达到2万次点击。2万次,是一个突破也是一个新的开始,继续努力的写自己。虽然文字很烂,但是我也依然要写。 \("▔□▔)/
谢谢大家的支持,2万次,让我想起北信驿站,一个温馨的小家。点击率快到10万的时候,我们整个开发小组守候在服务器前,一起耐心的等待着第10万位访问者。我们还设计了一张软件CD送给第10万位访问者(还是我自己设计和打印的封面)。北信驿站曾经也在过节的时候向一些忠实的网友派送过类似的礼物。不知道还有没有人保留着。当时的大学生活还是相当的温馨,特别是我们那个楼层。有传说中的Winder,有经常把服务器搞死的大饼,有经常在服务器上放色情图片的阿棍,还有负责动漫的Jenit。一转眼大学已经毕业5年多了。各奔东西的大家都好吗?找到自己的幸福了吗?如果找到了就请仅仅握住它。如果还没有,那么请你看一看我Spaces的副标题,深呼吸,充满希望继续努力吧。