分类
翻译

google将发布n-gram数据库

原文:http://blog.outer-court.com/archive/2006-08-03-n60.html
翻译:hidecloud
转载请注明以上信息
=======================================================

Google发布消息称:你将能订购6张包含Google N-gram数据库的DVD用来进行研究或开发。
如果我理解得对,这意味着你将得到一个超过十亿句由五个单词组成的句子,并能按流行程度排序,例如你能用mice、milk这样的词去完成cats like to eat这样的句子。
这应该对语音识别,OCR,机器翻译,拼写建议等技术有辅助作用。这个数据库将包含1300万个不同单词。

注:N-Gram是大词汇连续语音识别中常用的一种语言模型,对中文而言,我们称之为汉语语言模型(CLM, Chinese Language Model)。汉语语言模型利用上下文中相邻词间的搭配信息,在需要把连续无空格的拼音、笔划,或代表字母或笔划的数字,转换成汉字串(即句子)时,可以计算出具有最大概率的句子,从而实现到汉字的自动转换,无需用户手动选择,避开了许多汉字对应一个相同的拼音(或笔划串,或数字串)的重码问题。

分类
翻译

GOOGLE CHECKOUT发布!

转自:http://blog.outer-court.com/archive/2006-06-29-n64.html

作者:Philipp Lenssen

翻译:hidecloud www.hidecloud.com

转载请注明以上信息
====================================================================================
GOOGLE终于发布了传言已久的GOOGLE CHECKOUT(代号Sierra),一个PAYPAL型的可以不用输入个人信息、也不必记住不同密码的在线购物付款系统。
但是于PAYPAL不同,CHECKOUT不是一个用来收付款的在线银行帐号……它只是用来让你在类似星巴克、Levi’s、DVD empire或者BUY.com消费(支持的站点缺少一些重要的厂家,例如亚马逊在线)。GOOGLE建议你在ADWORDS的搜索页面里寻找
图标……是的,每一次点击GOOGLE都会赚到钱。(查看购物流程https://checkout.google.com/buyer/tour.html)

在向GOOGLE CHECKOUT输入我的信用卡信息后,我尝试去DVD EMPIRE购物,但是未能成功–我并不能用CHECKOUT付款,而是被要求创建一个DVD EMPIRE的帐号。我又在BUY.COM上尝试了一次,就如http://blog.outer-court.com/videos/google-checkout.wmv这段视频,这次那有了一个CHECK的按钮,但是整个过程还是走向了错误的方向。对GOOGLE来说这并不是一个好的开始,但也许这只是又一次常见的GOOGLE每日综合症(或者在美国外不提供支持)。
现在,GOOGLE账户对各种GOOGLE新添加的服务来说更加有影响了。看起来GOOGLE想成为所有网页内容层面下的软件层。一个网站管理员现在可以将GOOGLE BASE里的数据传送到自己的购物站点,然后通过GOOGLE ADWORDS来宣传自己,通过GOOGLE账户认证系统来添加GOOGLE的各种服务,通过GOOGLE WEB API来添加页面搜索,并允许用户通过GOOGLE CHECKOUT来购买产品。
而社区类站点可以通过GOOGLE ADSENSE来获得收入,并通过ADSENS API来分享收入,创建blogs(通过blogger),创建网页(通过GOOGLE PAGE CREATOR),创建讨论组(GOOGLE GROUPS),创建日程表(GOOGLE CALENDAR),分享视频(GOOGLE VIDEO),分享图片(PICASA 在线相册),查询地图(GOOGLE MAPS),等等……
这一切的基础都是:用户信任GOOGLE。问题是:他们会压榨我的数据吗?(原文:will they screw with my data or not?不太明白)

====================================================================================
译后:看来昨天GOOGLE账户认证系统发布后的感觉是真的,GOOGLE正在逐步成为互联网的底层服务提供商,这个平台如果真的成功运作起来,真是值得YY啊。