手机浏览器扫描二维码访问
这个完全可以根据前词判断是光还是世界。”
沃森弱弱提醒道:“教授,你还会俄语啊?”
林燃一副理所当然的样子:“当然,我都和科罗廖夫见了两面,我不会俄语怎么和他交流的?
我同时会俄语、德语、英语和汉语。”
多语言大师的身份,给林燃的理论增添了几分可信度。
在这个时代,科学家们会几门语言并不奇怪。
当然一些敏感部门会提高对你的怀疑。
以前面提到的约翰·麦卡锡为例,他就精通俄语,从小接受俄语教育长大,尽管他出生在阿美莉卡。
“另外翻译过程,应该是模块化设计,而不是简单的映射关系。
它应该分成预处理、翻译、后处理三部分。
预处理包括了分词和词形还原,翻译才是词典的映射,后处理是对语序进行调整。
这样来降低单次计算的复杂度,提高规则的复用率!”
林燃的话给了在座研究团队的成员们非常多的灵感。
就好像之前一直陷在百越的丛林里找不到出路,而现在天上出现一道光指引他们怎么样才能走出丛林迷宫。
大家都有点迫不及待去尝试了。
所有研究人员都疯狂在笔记本上记录下林燃所说的。
虽然不确定教授的方法是否管用,但有路总比之前没有好。
再者,如果你不好好记下来,到时候被开除只是教授一句话的事。
“好了刚才我们讲了一些简单的内容,现在才是最难的。
因为IBM的机器不是那么强大,我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。
我把它叫做基于频率的词对齐。
这也是我们引入统计模型的核。
我们先要手动分析平行句子,标注俄语词或短语与英语翻译的对应关系。
俄语句子Мыговоримомире
英语翻译:“Wespeakaboutpeace
对齐结果:“мы”对应“we”
“говорим”对应“speak”
“о”对应“about”
“мире”对应“peace”
然后我们需要对这种对齐的频率进行统计。
统计每个俄语词或短语在英语中的对应翻译出现的频率。
例如,在语料中,“говорим”在80%的句子中翻译为“speak”,20%翻译为“talk”。
这样对于我们就可以构建概率表了。
将这些概率整理成表格,供机器进行查询。由于内存空间有限,我们暂时只存储高频词对,像出现次数前1000的词对,忽略低频情况。
当翻译某个词的时候出现多个选择,就参考概率表选择最可能的翻译。
神魔陵园位于天元大6中部地带,整片陵园除了安葬着人类历代的最强者异类中的顶级修炼者外,其余每一座坟墓都埋葬着一位远古的神或魔,这是一片属于神魔的安息之地。一个平凡的青年死去万载岁月之后,从远古神墓中复活而出,望着那如林的神魔墓碑,他心中充满了震撼。沧海桑田,万载岁月悠悠而过,整个世界彻底改变了,原本有一海峡之隔的...
师父死了,留下美艳师娘,一堆的人打主意,李福根要怎么才能保住师娘呢?...
成仙难,难于上青冥!修真难,没有法宝没有丹药没有威力巨大的符箓,没有强悍的天赋。但是自从有了位面商铺就不一样了,有了位面商铺一切都有了。什么,修真界最普通的洗髓丹在你那里是绝世神丹!什么,你们那个位面遍地都是各种精金矿物,精铁灰常便宜!前世走私军火的商人,今生在修真界同样要将商人当做自己终生的追求。我只是一个做生意的,修炼真仙大道只是我一个副业。成为位面商铺之主,横扫诸天万界。商铺在手,天下我有!...
赵敏的娇蛮狐媚周芷若的举止优雅小昭的温柔体贴不悔的秀丽美艳蛛儿的任性刁蛮 一梦醒来,该是倚天屠龙的另一个新主角上场了...
一个小千世界狂热迷恋修行的少年获得大千世界半神的神格,人生从这一刻改变,跳出法则之外,逆天顺天,尽在掌握!骷髅精灵不能说的秘密,尽在火热圣堂,等你来战!...
张湖畔,张三丰最出色的弟子,百年进入元婴期境界的修真奇才。他是张三丰飞升后张三丰所有仙器,灵药,甚至玄武大帝修炼仙境的唯一继承者,也是武当派最高者。在张三丰飞升后,奉师命下山修行。大学生,酒吧服务员,普通工人不同的身份,不同的生活,总是有丰富多彩的人生,不同的遭遇,动人的感情,总是让人沉醉不已。武林高手...