您好,欢迎来到中国产经网我要投稿

当前您在:主页 > 科技要闻 > 业内资讯 >
正文

邓侃:谷歌Talk to books引爆搜索方式革命

  
新智元专栏

  新智元专栏

  作者:邓侃

  昨天,新智元介绍了谷歌的全新搜索工具“Talk to Books”,基于自然语言文本理解,用户能够凭语义而非关键词来实现搜索功能。谷歌搜索的“AI化”令人眼前一亮,谷歌是否即将从当今的搜索引擎,革命性地进化到了回答引擎?本文作者,大数医达创始人、CMU 博士邓侃对谷歌的这个新搜索工具的技术原理进行了解读。

  

今天读到一则新闻,“谷歌发大招:搜索全面AI化,不用关键词就能轻松撩书”。

  今天读到一则新闻,“谷歌发大招:搜索全面AI化,不用关键词就能轻松撩书”。

  介绍产品 Talk to Books 时,作者放了一张产品截图。

  当用户提问 “What is fun about computer programming?” Talk to Books 自动回答,

  “... has been beneficial on many levels. First, computer programming provides a palette with a virtually unlimited potential for creative expression; the thrill of bringing a useful porgram to life rivals the thrill of hearning a new composition being performed for the fist time. Second, a knowledge of computer ...”

  from Arduino for Musicians: A complete Guide to Arduino and Teensy Microcontrollers by Brent Edstrom.

  

邓侃:谷歌Talk to books引爆搜索方式革命

  这个例子很震撼,几个原因:

  1. 从搜索到回答:

  谷歌当今的搜索结果,只是给出文章的链接。而 Talk to Books 的搜索结果,虽然是书的摘要,但是摘要摘得如此精当,几乎是问题的回答。这篇博文是不是在暗示,

  谷歌即将从当今的搜索引擎,革命性地进化到了回答引擎?

  2. 语义理解:

  长期担任过谷歌搜索业务主管,Amit Singhal,在其任内,曾经亲自领衔主持谷歌知识图谱的实现。在介绍知识图谱的价值时,Amit Singhal 说,

  谷歌将不再搜索关键词表面上的字符串 “string”,而将直接搜索关键词的内涵语义 “thing”。

  在 Talk to Books 的这个例子中,提问中包含 “fun”,而答案中与之呼应的词,包括 “beneficial”、“palette”、“thrill” 等等。注意,是呼应,是相关词,但不是同义词近义词。

  如何迅速找到同义词、近义词、相关词?不难猜测,一定与

  词向量

  有关。如果仅仅用词向量,取代文字表述的词汇,那么基于词向量的搜索引擎,最多是模糊匹配的搜索引擎,但是并非是截图暗示的那种回答引擎。

  3. 文章张量树:

  论文 [4] 的具体做法是,先把每一篇文章中的每一个词汇,翻译成词汇张量。然后从每一个语句的一连串词汇张量中,提炼出语句张量。再然后把每一个段落的一连串语句张量中,提炼出段落张量。最后从段落张量中,提炼出整个文章的文章张量。

  这样,

  每篇文章,就构成一个树状的张量集合。

  根节点是整个文章的中心思想的文章张量,上层中间节点是段落张量,下层中间节点是语句张量,每个叶子节点是词汇张量。

  4. 问答匹配:

  输入一个提问语句,Talk to Books 先把提问语句,翻译成一个定长的数值张量,然后在众多文章的张量森林中,寻找最贴切的词汇张量,也就是某棵树的叶子节点。如果不行,就寻找最贴切的语句张量,也就是某棵树的下层中间节点。如果不行,就寻找最贴切的段落张量,也就是某棵树的上层中间节点。如果还不行,就寻找最贴切的文章张量,也就是某棵树的根节点。

上一篇:推销短信“退订回T”就行了吗?太天真了,代发平台说...
下一篇:没有了
本文关键词:
关于中国产经网
中国产经网是目前国内专业的产经经济新闻网站,目前开设栏目产业资讯、财经热点、互联网、科技新闻等栏目。
联系我们
中国产经网版权所有
1909395204@qq.com
QQ:1909395204
地址:北京是朝阳区光华路4号
站长统计  |