新获谷歌专利揭示搜索引擎看到实体
- 微引流
- 2022-04-28 17:55
新获谷歌专利揭示搜索引擎看到实体专栏作家深圳网站设计解释了最近谷歌的专利,暗示在搜索引擎处理的实体信息回答问题
网站搜索引擎优化
了解我的人都知道我是一个大风扇的阅读谷歌专利,或者,当我感觉懒惰,阅读他们的分析,BS在他的博客里,SEO的海
网站优化
我也在那些涉及实体特别感兴趣,因为他们是(至少对我来说)的定义是谷歌试图解决的问题
根据专利,定义如下:[一]实体是一个事物或概念,是独特的,独特的,明确的和可区分的
例如,一个实体可以是人、地方、项目、理念、抽象的概念,具体的元素,其他合适的东西,或它们的任意组合
本文将结构化的方式,我将包括在斜体专利重要路段的确切措辞,其次是每一节意味着什么的一个解释
摘要方法,系统和计算机可读介质提供集体和解
在一些实施方案中,接收查询时,其中的查询相关的至少部分与实体类型
先前生成的数据检索的一个或多个搜索结果的至少一个搜索结果相关,包括一个或多个在至少一个搜索结果对应的实体类型的实体引用的数据
要查询的答案是至少部分地基于实体结果提供
就抽象而言,我们要看到的是,实体获得排名,而排名确定一个查询的答案
概要以下摘录都包含在该专利的摘要部分
节关键词排名[一]系统依靠实体引用确定的基础与搜索结果相关的非结构化数据提供自然语言搜索查询的答案
谷歌是在这里讨论的是确定的回答谁的问题的想法,他们将出现在搜索结果的前名最常见的名字
节[T]他查询是一种自然语言查询排名的一个或多个实体引用,包括基于至少一个信号排名排名
在一些实施方案中,一个或多个排序信号包括频率的各个实体引用的发生
在一些实施方案中,一个或多个排序信号包括各实体引用局部性评分
在一些实施方案中,先前生成的数据与非结构化数据
进一步的信息上的方法是在专利概述,我们看到在一个文档中使用的术语的频率,可能跨越多个文件
此外,我们看到,性是一个关联因素,这是应用于非结构化数据的方法
在一些实施方案中,问答可以利用搜索结果排序技术
在一些实施方案中,问题的答案可能是基于网络的非结构化内容自动识别
在这里,我们看到谷歌阐明不同类型的实体和答案可能是基于不同的信息
例如,新鲜度可以作为一个更强的信号如果你看天气,而质量可能如果你正在寻找一个定义更强壮,健康信息等
本节涉及的专利图,如下:一个问答按照目前披露的一些实现高水平的系统框图
一个高层次的系统的框图问答,按照一些实现本发明的
他们写的:[从实体引用与一个特定的网页相关的检索]他信息列表出现在网页的人
这可以理解,在一些实施方案中,实体引用和指数可能存储在一个单一的指标,多指标,在任何其他适用的结构,或它们的任意组合
其中一个大问题,我想到在阅读该专利是巨大的处理能力要
在节中,他们讨论了这个方法,这是预设的参考文献列表(图)从指标本身分开
节[O]NE或更多的排名指标是用来实体引用的排名,包括发生频率和话题性评分
虽然这可能涉及到一个网站的主题和加权参考应该有关联,我倾向于相信这更多的是有助于理解实体引用
看到更多的音乐的主题相关的网页会帮助他们在选择显示:谷歌的结果,谁是节[T]他系统订单,基于一个或多个质量分数的搜索结果
在一些实施方案中,质量分数包括相关的搜索查询,与搜索结果相关的质量得分,一个数据的时候,内容最后生成或更新相关的新鲜度评分,与特定的搜索结果以前的选择从一系列的搜索结果评分,其他合适的质量分数,或任何组合
在一个例子中,一个与搜索结果相关的质量得分可能包括链接的数量和相应的网页
在节中,我们看到更多的质量评分澄清作为度量
在一些实施方案中,实体引用人实体引用,例如,出现在一个网页的文本的人的名字
这就首先提到在互联网上一个人发生,新建筑的开发等
在一些实施方案中,系统进行离线处理,这样在搜索的时候获得
在一些实施方案中,该系统处理信息的实时搜索的时间
我们也看到参考系统,实时操作
显然,有查询类型,就需要这个(天气),和一个可以认为谷歌将有可靠来源的这类信息的列表,使他们仍然处理信息迅速,以最少的资源
节[我]是条目包括实体引用,一个独特的标识符和实体引用相关的实体引用的频率发生,在实体引用出现的页的位置,与内容如新鲜和订购相关的元数据,其他任何适用的数据,或它们的任意组合
在一些实施方案中,先前生成的数据包括识别实体作为一个特定类型的信息,如人的实体引用,一个实体引用,或一次实体引用
在一些实施方案中,多个数据集可以为网站或其他内容,其中每一组都与一个或多个类型相关
你或我都会想到他们的名字的人,谷歌不会;他们会认为他们的独特的、可能的字母数字、序列
我会说明下文,但在其最简单的形式,它可能看起来像:UID(A)&;&;的名字(DD)-&;工作(音乐家)和UID()&;&;的名字(DD)-&;工作(SEO)过去,这一部分主要强调认识SEO和关联性强化因素如实体使用频率,对内容、链接的网页的位置,等等
在这一部分中,我们进一步看到实体是如何通过上下文理解
节另一个例子中,系统通过将出场的文档或任何其他合适的度量长度决定了频率
有趣的是,这正是他们在这里,在这方面确实有道理
尽管如此,你可能从来没有读过或听到的唯一ID再次关键词密度参考
在一些实现中,节点可以被分配一个独特的识别标准
在一些实施方案中,独特的识别可以参考一个字母数字字符串,一个名字,一个数字,二进制代码,任何其他合适的标识符,或它们的任意组合
在节中,我们得到了澄清的分化(解决的情况下,有很多的名字,一个实体例如:电影,电影,电影)和消歧(解决方案有一个名字由多个实体&;例如:DD分享)
我们说的话的唯一标识符和其使用的部分
总之,你不是你,没有实体本身是在我们沟通
每个实体都是一个独特的身份,和唯一的ID分配给节点,包括常见的参考资料,如姓名和特征
节[不]在这里可能是城市[费城]相关实体的节点,对电影[费城]相关实体的节点,和奶油奶酪品牌[费城]相关实体节点
每一个节点可以有一个独特的识别依据,存储例如数、消歧在知识图
它可以理解,更复杂的关系也可以定义并区分节点
在第节讨论如何具体的实体可以由节点和连接识别,真正重要的是,这是一种他们将决定哪个答案更可能是正确的
如果我改变我的问题:有多少人在费城
答案是谷歌给出的是万
它可以用在电影的演员总数的回答,但它选择了什么感觉是最有可能的答案是寻求基于实体和被寻找的数据帧
节【N】颂歌和边缘的实体类型定义节点与其性能之间的关系,从而定义一个模式
在这里,我们看到谷歌基本上把非结构化数据到一个结构通过创建自己的模式的边和节点在以前的定义
这将使谷歌的人产生自己的图式(例如)不断调整、和删除与之相关的图式
节[的]各自的知识图保持各自不同的领域,不同的各自的实体类型,或根据任何其他合适的界定特征
在本节中,我们看到谷歌针对不同类型的数据创建知识图的不同类型
这是不同的,框架基于信息所要求的类型的答案
现在我们已经进入了信息的关键位结束,你可能会问,怎么样
在了解谷歌如何组织数据,本身是一件好事,有具体的可操作的项目我们可以带走这可以显著提高我们的排名和相关性
最好的部分是,他们不努力,实际上并不需要太多的努力只是了解你想要什么
好的,现在我要脱下我的队长的帽子,指出,如果我们只看现场回答来自什么数据有实体,我们可以更了解谷歌找到相关的特定主题
而谷歌要给一个答案,他们也希望他们的用户有机会获得更完整的数据,如果需要的话
因此,他们将更可能排名的网站,而不只是他们想要的答案,但可能支持信息的搜索也可以找
语句如扭结DD将有可能达到正确的实体;然而,数据将不会被视为全面完成
好的谷歌,因为他们可以在其他地方获得的信息
不过,如果我们想要好的排名,我们应该努力彻底
如果你看了这个问题的答案,谁是上面,你会发现答案是段落格式
因此,如果我们有DD的一页,我们要结构信息在段落格式而不是列表
结论实体,在我如此卑微的意见,了解谷歌的算法最重要的一个方面,而这项专利增加了理解
理解实体是如何理解谷歌的看法它遇到的每件事物之间的