第165章你渴望推开那扇门么(2)

    恰在此时，尹芙·卡莉向林灰建议要林灰再找一个翻译，这样就可以直接同声传译了。

    所谓的同声传译，是指翻译人员在不打断交流者谈话的时候进行翻译同传工作，这样能使交流的效率大大提高。

    不得不说，这样的建议确实不错。

    不然的话即便米娜·卡莉能够胜任翻译工作。

    林灰和尹芙间隔交流的话沟通效率也不会很高。

    不过林灰该去哪找个翻译呢？

    而且是需要既有计算机背景又能胜任翻译工作的人。

    林灰一下子就想到了黄静。

    林灰记得黄静可是南加大的硕士。

    这样的学位充当一下计算机方面的翻译似乎问题不大。

    林灰通过电话试探地询问了黄静的意见。

    黄静等待林灰的召唤似乎等了很久了。

    根本没等林灰细说。

    几乎不假思索就答应了林灰的请求。

    ……

    尹芙·卡莉和米娜·卡莉在酒店安顿下来之后。

    大概23号下午三点左右。

    四人展开了学术上的讨论。

    当然主要是林灰和尹芙·卡莉进行讨论。

    这次的讨论的性质有点类似于一个小型的座谈会或者说一次头脑风暴。

    这次见面的地点并不是在公开场合，而是在状元学府1号楼的601。

    这个地方是前不久林灰在表彰大会上获奖的那套商品房。

    在表彰大会上获得的150万现金。

    林灰没有留着，直接给父母了，当然这笔钱给父母的过程林灰可是很费了一番周折的。

    这套房子林灰原本也打算让给父母的，不过林父林母拒绝了。

    林灰家里也不算缺房子住。

    林灰也没坚持，这套房子索性他自己就留着了。

    说起来林灰还是第一次来这个地方。

    一百三十多平的带装房。

    这年头房子基本都差不多，布局什么的照往后几年的还差点。

    当然了，林灰是作为奖品获得的这套房子。

    他似乎还没有挑挑拣拣的余地。

    状元学府这边地方还不错。

    在北域城西这边的老城，虽然离三小在内的周边的学校都不远。

    但此处闹中取静，别有一番风味。

    距离此处不远是一个新落成的人工湖。

    风景还算不错。

    环境相对来说也比较安静。

    正是因为这些原因，林灰才将这个地方选择作为洽谈地点。

    环境安静的话比较有利于深度思考。

    谈论开始了，尹芙·卡莉先是跟林灰介绍了她在研究中遇到的诸多难处。

    事实上这些东西林灰记得尹芙·卡莉在先前发来的邮件中就已经阐述过了。

    只不过现在阐述地更加详细了。

    林灰耐心地听着。

    林先前担心地似乎有点多余。

    米娜·卡莉虽然不是从事过相关专业的。

    但到底是姐妹情深，尹芙·卡莉在表述的时候都是用尽可能通俗易懂的语言。

    尽量照顾着米娜的感受。

    甚至有些时候林灰都能直接听懂尹芙·卡莉所表达的内容。

    尽管如此，林灰依然没丢掉翻译(黄静)跟尹芙·卡莉沟通。

    有些大牛明明自己会英文。

    为什么涉及到一些重要场合仍然要带翻译呢？

    翻译不完全是为了翻译本身。

    更多是为了一定的容错性。

    虽然涉及到文本摘要这种东西林灰都是相当熟悉不过的，很少出现错误。

    但毕竟两个时空是有些区别的。

    林灰不小心表暴露了什么岂不尴尬。

    在常人面前如果林灰不小心暴露了什么专业上的马脚可能很难被发现。

    如果是直接同尹芙·卡莉交流的话。

    面对着一个同行直接交谈的话，林灰并不能保证不会露出马脚。

    有翻译在的话，多多少少多了一层缓冲。

    尽管如此，林灰说话依旧要慎之又慎。

    尹芙·卡莉向林灰着重介绍了这个时空里人们是如何评估文本相似度的。

    按照尹芙卡莉的表述，林灰才知道。

    原来此时这个时空的人们主要是利用基于知识库的方法来计算语义文本相似度的。

    不过这个时空人们主要是利用基于网络知识的方法来计算的。

    林灰知道这种方法的。

    这类方法是基于知识库计算相似度的一种。

    这种方法主要利用网络大型知识库资源，如wiki百科和摆渡百科等。

    通过网页内容和网页间的超链接进行相似度计算。

    随着互联网的快速发展，网络知识愈加丰富。

    能够充分利用网络中的资源进行语义文本相似度计算自然是一个不错的思路。

    不过基于知识库的方法来计算语义文本相似度可不只是这一种方法。

    据林灰所知基于知识库的语义文本相似度计算方法根据知识库的类型其实是可以分为两大类。

    除了基于网络知识方法的话。

    还有一类是基于本体的方法。

    这类方法运用结构化语义词典进行计算。

    其基本思想就是运用这些语义词典中包含的概念信息和概念间的层次关系进行语义文本相似度计算。

    按理说既然想到了基于知识库的语义文本相似度计算方法的话应该首先想到基于本体的相似度计算方法才对才对啊。

    为什么没先想到基于本体的方法？

    反而先想到了基于网络知识的方法？

    回想起尹芙先前的自我介绍，林灰恍然大悟。

    尹芙的团队没想到这种方法也可以理解。

    毕竟尹芙他们的团队原本是和谷/歌方面深度合作的。

    基于网络知识的方法利用网页内容和超链接相似度进行计算的话虽然不容易。

    但谷/歌的老本行pagerank算法引入到nlp领域后实现的功能本就跟这个差不多。

    这样看来，和谷/歌方面的团队有过深度合作关系的尹芙团队忽视基于本体的方法而直接选择基于网络知识的方法也是可以理解的。

    说起来基于网络知识方法计算相似度实现起来并不容易。

    毕竟网页中知识颗粒度较粗。

    说白了就是网页中有用的东西少。

    加之部分网页的知识结构化程度较低。

    如果直接对所有的网页链接进行分析，会导致知识含量稀疏、计算困难等问题。

    因此必须找网页结构高同时知识内容集中的网页才适合开发基于网络知识评估文本相似度的方法。

    什么样的网页具有这一特征呢？

    wiki百科和摆渡百科。

添加书签

第165章 你渴望推开那扇门么(2)

第165章你渴望推开那扇门么(2)