AI模型中的结构化数据(schema.org)和内容可见性

在人工智能越来越多地决定用户在搜索结果中看到的内容的世界中,结构化数据正成为SEO策略中越来越重要的一部分。直到几年前,它们的主要作用是让谷歌更容易理解页面的上下文——但今天,它们允许ChatGPT、Gemini或Copilot等语言模型正确解释内容,赋予其含义并在生成响应中引用它。

以下是结构化数据指南。了解schema.org原理、熟练实施结构化数据并保持其一致性,现在是人工智能时代有效品牌知名度越来越重要的要素。在本文中,我们将了解SEO中的结构化数据如何影响AI模型对内容的解释,以及哪些类型的Schema最重要,以及它们如何影响每个LLM模型中的流量。

结构化数据到底是什么,它是如何工作的?

什么是模式?结构化数据是一种在网站上存储信息的特殊方式,可帮助搜索引擎和人工智能模型更好地准确理解内容——无论是文章、产品、评论、活动、职位列表还是公司简介。与人类可以直观解释的经典文本不同,算法需要清晰明确的语义线索。因此,结构化数据充当人与机器之间的一种“翻译器”,借助它,Google、Bing、ChatGPT、Copilot或Gemini等系统能够正确分配页面的上下文、含义和目的。

从技术上讲,这些数据采用放置在页面结构中的代码形式——通常采用JSON-LD格式(Google推荐),尽管在某些项目中也使用微数据或RDF。例如,如果经营一家本地服务公司,则结构化数据允许指定其名称、地址、营业时间和联系信息。对于在线商店——它们将定义产品名称、价格、可用性和用户意见。对于专家博客-它们允许将文章链接到其作者、发布日期和来源。

在实践中,这意味着正确实施的结构化数据有助于人工智能算法将网站识别为可靠的信息来源。这反过来又增加了出现在Google AI Overview等结果中的机会,或者在各种类型的LLM代理(例如ChatGPT)中出现有关给定公司的信息。在新的搜索生态系统中,传统的结果列表正在让位于语言模型生成的合成响应,结构化数据的可读性正成为品牌知名度越来越重要的条件。

经典SEO与AI中页面可见性优化之间的区别

直到几年前,SEO主要关注关键字、链接和网站结构。然而,今天,在内容解释中发挥主导作用的是语义——即意义,而不仅仅是特定短语的出现。人工智能模型不像人类那样“读取”内容——它们在来自不同来源的概念、实体和数据之间的联系背景下对其进行分析。这就是为什么结构化数据已成为SEO的新语言。

在经典的SEO方法中,结构化数据主要有助于显示丰富的片段——评分、星级、常见问题解答部分或产品图片。在新的搜索生态系统中,内容由生成模型处理,它们的作用变得更加重要。Schema.org最重要的是,它会影响人工智能对页面上下文的更好理解——这意味着公司有更好的机会在模型的响应中被引用,而不仅仅是在Google结果中。

从丰富的片段到生成式响应:AI如何“读取”结构化数据

语言模型从上下文数据中学习,而结构化数据以最精确的方式为它们提供该上下文。多亏了schema.org,人工智能可以区分评论和产品描述,以及SEO专家和烹饪博客的作者。

因此,生成模型可能会更频繁地引用使用模式数据正确标记的内容,因为系统可能会将其视为更可靠且更易于解释。

实体和上下文——决定人工智能中引文相关性的关键概念

要了解人工智能模型如何“看到”网站的内容,需要暂时忘记经典的SEO和关键字。对于人工智能来说,重要的不是使用一个短语的频率,而是系统是否能够清楚地识别在说什么和谁。

这就是实体发挥作用的地方——即可识别的概念、人物、地点、组织、产品或事件,这些概念、人物、地点、组织、产品或事件可以明确地与特定环境联系起来。

从技术上讲,这意味着实体充当通过关系连接的知识节点。结构化数据(例如文章、组织、本地业务、人员、产品)允许人工智能从这些节点构建意义网络。

重要的是,谷歌和其他搜索引擎不再仅基于内容——谷歌和人工智能机器人还同时分析多个来源中实体之间的关系。这意味着当今网站、社交资料、谷歌地图和外部引文(例如企业目录)之间的数据一致性直接影响人工智能是否会发现内容值得信赖。

schema.org是一个排名因素,或者更确切地说是可见性的“语言”?

这是当今大多数SEO专业人士和网站所有者问自己的问题:实施结构化数据真的能提高在搜索结果中的排名吗?

正确实施的结构化数据充当“语义层”——帮助Google和AI模型准确解释所呈现的内容:无论是产品描述、评论、专家文章、名片还是常见问题解答。这些信息越易于理解和准确,数据在富媒体搜索结果、AI概览、精选片段或语音回复中使用的机会就越大。

然而,应该强调的是,仅仅存在该计划并不是一切。谷歌和其他系统还分析结构化数据与页面实际内容的一致性。如果架构描述了产品,但页面缺少价格信息或照片,则算法可能会认为数据不可靠并忽略它。它在人工智能的上下文中的工作原理类似——语言模型不会使用在内容的真实上下文中未经确认的数据。

在实践中——缺乏结构化数据不会导致网站记录可见性下降,但它的存在可以使页面内容被理解并注意到其他人将保持不可见的地方。

提高人工智能内容可见性的关键结构化数据类型

结构化数据可以通过多种方式实现,但并非所有类型的schema.org都会对人工智能驱动的系统中内容的可见性产生相同的影响。下面,我将介绍我认为Schema中最受欢迎的5个元素:Article、FAQPage、Product、LocalBusiness和Organization。它们
每个都负责可见性的不同方面。

架构文章

架构文章是任何博客、教育、行业和专家内容的基本结构化数据类型。它的任务是清楚地确定给定页面是否包含一篇文章——即信息材料,由特定作者撰写,由特定品牌在特定时间和上下文发布。

多亏了Article,人工智能模型能够识别出版物的性质并将作者与组织联系起来。这在人工智能概述的背景下至关重要,人工智能概述越来越多地引用来自描述良好的网站的行业文章和操作方法文章。

在实践中,文章类型的结构化数据应包括:

  • 标题(title)
  • author(个人或组织→作者)
  • 出版日期(datePublished)
  • 以及对文章URL(mainEntityOfPage)的引用

计划常见问题Page

FAQPage(常见问题解答架构)描述了包含问题和答案部分的页面。几年前,它主要用于获取丰富的结果扩展,但今天它可以帮助人工智能模型更快地识别回答特定问题的内容。

常见问题Page在操作方法文章或优惠页面上效果很好,其中的内容回答了用户的具体问题。实施良好的FAQPage增加了内容片段在AI概述中被引用或在所谓的“人们也问”中被召回的机会。仅在实际存在Q&A部分的地方使用FAQPage。谷歌越来越多地验证架构和可见内容之间的一致性——如果架构没有在HTML中得到确认,它可能会被忽略。

架构产品

Schema Product是电子商务结构化数据的支柱。多亏了它,搜索引擎和人工智能模型可以识别:价格、产品类型、可用性、制造商和用户评论。语言模型(例如在Copilot或Perplexity中)可以根据标记的数据生成产品推荐。

人工智能模型分析这些数据,将产品与用户查询相匹配(“最高300元的最佳咖啡套餐”)——描述良好的产品模式增加了报价出现在人工智能结果中的机会。

Schema LocalBusiness–人工智能时代本地企业的基础

对于在当地运营的公司(办公室、餐厅、实体店)来说,LocalBusiness计划是绝对必须的。多亏了它,Google、Bing、ChatGPT或Gemini可以更好地将公司名称、地址、营业时间和联系方式与现实世界中的特定位置相关联。

正是LocalBusiness模式支持品牌出现在Google地图、本地结果(“我附近”、“附近”)以及越来越多地使用地理位置数据的生成结果中这一事实。描述良好的LocalBusiness Schema增加了AI选择企业作为上下文查询答案的机会。

要使LocalBusiness架构正常工作,它必须包含一些必需元素:

  • 公司名称
  • address(地址→PostalAddress)
  • 电话号码
  • 开放时间(openingHours)
  • 并可选择链接到社交资料(sameAs)

此架构中的数据应与Google商家资料(以前称为“Google我的商家”)中的数据相同。人工智能可以验证来源之间信息的一致性。

此外,可能想要添加地理(地理坐标),这样可以更轻松地将位置与用户的查询相关联。对于多地点企业,可以实施多个LocalBusiness计划——每个分支机构或分支机构一个。

架构组织——它如何建立品牌信誉和来源权威

架构组织是结构化数据中最重要但同时也是最容易被忽视的元素之一。它可以帮助谷歌和人工智能模型了解谁是已发布内容的幕后、谁拥有该域名以及哪个组织负责其可信度。

在人工智能时代,生成模型不仅从内容中学习,还从源头的声誉中学习,Schema Organization充当品牌标识的数字证书。多亏了它,系统可以将公司名称与其徽标、总部、网站、LinkedIn个人资料或YouTube频道相结合。因此,品牌在知识图谱中被识别为真实实体,这增加了被引用和出现在所谓的实体面板或AI概述中的机会。

同样重要的是,组织模式链接到网站上的其他模式——例如文章(通过出版商)或LocalBusiness(如果公司位于本地)。这样的关系网络建立了语义连贯性,人工智能将其视为权威信号。

当人工智能模型处理内容时,它们通常会分析“信任来源”。包含完整组织数据的页面可能被视为可靠的作者来源,这可能会对生成式回复的可见性产生直接影响。在实践中,正是由于Schema Organization,品牌才出现在AI Overviews中,旁边是专家和行业出版物的名称。

实施结构化数据–实用技巧和良好实践

JSON-LD、Microdata或RDFa–选择哪种格式,为什么?

在我们开始实施结构化数据之前,重要的是要了解schema.org不是单一的标准,而是一组可以用不同技术格式实现的定义。最流行的是JSON-LD、Microdata和RDFa。所有这些都允许搜索引擎理解页面的结构,但在它们的实现方式、灵活性和防错性方面有所不同。

JSON-LD–Google推荐且最易于维护

JSON-LD(JavaScript Object Notation for Linked Data)是目前的行业标准,由谷歌和最大的搜索引擎正式推荐。

它最大的优点是数据与HTML内容分离——可以将其添加到一段代码中(通常在头或正文的末尾),这使得批量更新、测试和部署变得容易。

JSON-LD在前端经常修改的动态环境(WordPress、Shopify、Webflow、ReactNext.js)中效果很好。

由于HTML结构的独立性,即使网站外观发生重大变化也不会影响标记的操作。

微数据–开始时不错,但难以维护

微数据在页面是静态的,结构化数据直接标记到HTML内容中的时代很流行。

在这种格式中,信息是通过itemprop、itemscope和itemtype属性添加的——也就是说,实际上将文本片段“包装”在语义标记中。

虽然这对于小型站点来说很方便,但对于大型项目(尤其是具有现代前端或组件)来说,微数据变得难以维护。

对HTML结构的任何更改都可能损坏数据,并且调试错误比在JSON-LD中更耗时。

RDFa–用于高级语义项目

RDFa(属性中的资源描述框架)是编写结构化数据最灵活、最精确的形式,主要用于大型研究、教育或百科全书式项目。

它允许在实体之间创建高度复杂的关系,并一次引用多个上下文。

然而,在商业实践中——例如在公司或电子商务的SEO中——这种情况相对罕见,因为它的实施需要高度的精度和RDF语义知识。

如何在Google富媒体搜索结果测试和Search Console中验证架构?

实施结构化数据只是第一步。另一个——同样重要的——是验证该计划的正确性。

JSON-LD结构中的错误、字段名称中的拼写错误、缺少必需的属性或与实际内容不一致都可能导致结构化数据被Google和AI模型完全忽略。因此,应测试每个已实现的Schema片段。

1.Google Rich Results Test–必备验证工具

检查架构正确性的最简单、最直观的方法是Google富媒体搜索结果测试工具。它允许检查单个URL和一段JSON-LD、微数据或RDF代码。

怎么运作的:

  • 粘贴页面链接或标记。
  • Google分析数据,指示已识别的模式类型(例如文章、常见问题解答、产品)。
  • 会收到包含错误和警告的报告。

错误–这些是阻碍正确理解数据的因素(例如,产品中缺少名称字段)。
警告–不要阻止架构运行,但通知缺少可选的推荐字段。

这个工具有一个巨大的优势——甚至可以在将代码部署到网站之前粘贴代码,这样就可以立即知道架构是否正确并准备好发布。验证结果还显示了数据是否符合富媒体搜索结果的条件,这间接证实了该标记已被Google系统很好地识别。

2.Google Search Console–实践中实施数据的分析

实施架构后,最好转到Google Search Console(GSC),它会监控整个域中已实施的结构化数据。

在“增强功能”部分,将找到针对不同类型数据的单独报告,例如常见问题解答、产品、文章、面包屑、LocalBusiness等。

GSC报告显示:

  • 具有正确数据的页数
  • 错误页数
  • 带有警告的页数
  • 以及随时间变化的趋势(误差是增加还是减少)

这可以跟踪部署的模式是否正常工作,以及前端更新后是否有任何新的错误。请务必记住,GSC错误并不总是立即出现-有时Google需要几天时间才能重新索引页面并更新报告。

如果在GSC中看到警告,但没有看到错误,请不要惊慌。这些只是优化建议,而不是拒绝模式的理由。另一方面,错误需要改进,因为它们可能导致谷歌系统或人工智能模型无法分析数据。

3.页码中的交替测试和人工检查

除了官方的谷歌工具外,还值得使用:

  • Schema Markup Validator–分析是否符合schema.org标准。
  • Ahrefs/Semrush/Screaming Frog–用于自动检测和审核大型网站中的方案。
  • 在源代码中手动检查(Ctrl+U/Ctrl+F→“ld+json”)。

schema.org实施中最常见的错误是什么以及如何避免这些错误?

许多营销人员和开发人员认为,如果结构化数据在Google工具中经过验证,那么一切都很好。不幸的是,这只是事实的一半。Google Rich Results Test仅确认技术正确性,但不能确认数据是否有意义、与内容一致以及对AI模型有用。因此,许多已实施schema.org的页面仍然无法在结果中获得可见性或出现在生成式响应中。那么让我们来看看最常见的错误以及避免这些错误的方法。

1.网站的模式与实际内容缺乏一致性

这是最常见的错误,同时也是最严重的错误。结构化数据必须完全反映用户可以看到的内容。如果产品架构中的价格与页面上列出的价格不同,LocalBusiness架构中的地址与页脚中的地址不同,或者常见问题解答中存在实际不在内容中的问题,则Google认为这是语义操作。

为避免这种错误,最好从与内容相同的来源生成结构化数据,例如直接从CMS、数据库或API生成结构化数据。部署后,应始终将标记与HTML代码进行比较(例如,在页面源视图中),并确保架构补充内容,并且不要尝试替换它。

2.模式类型的重复或重叠

这是Yoast、Rank Math或SEOPress等自动SEO插件的用户中尤其常见的问题。这些工具通常会自动生成文章、网页或博客发布数据,从而导致冲突和重复。在这种情况下,Google会随机选择其中一种类型,而忽略其他类型,这会导致页面丢失其语义上下文。为避免这种情况,重要的是要注意,一个页面上不应有两篇文章或两个组织。

3.使用已弃用或不正确的属性

Schema.org会不断更新,因此使用旧字段或错误类型可能会导致搜索引擎和人工智能模型对数据的误解。许多公司仍在使用已弃用或替换为新属性的属性。为避免这种情况,最好定期检查schema.org的当前文档,尤其是待处理的模式和弃用部分,并使用官方的Google示例。部署的每个架构都必须在富媒体搜索结果测试工具中进行测试,然后才能到达页面。

4.在一页上放太多图表

有些人试图通过在单个页面上添加尽可能多的架构类型来提高可见性,这会导致语义混乱。Google更喜欢清晰的单线程上下文——例如,文章页面上应该有一个主要文章,而不是一组文章、产品、常见问题和事件。最佳实践是根据页面的目的选择方案:博客-文章,报价-产品或服务,以及位置子页面-LocalBusiness。如果需要组合不同的上下文,这应该通过页面之间的链接来完成,而不是在单个方案中。

5.内容更改后无更新

模式不是“添加一次就忘记它”的元素。更改文章标题、产品名称、公司地址或营业时间需要更新结构化数据。过时的原理图是一种低质量的信号,在极端情况下,它们可能被视为操纵的尝试。对内容的任何修改都应自动涉及更新适当的架构。

结构化数据如何支持本地搜索引擎优化和电子商务?

实施结构化数据(schema.org)是一种可以提高人工智能搜索引擎的可见性、可信度和转化率的方法。准备充分的架构不仅可以影响对网站内容的更好理解,还可以使其在结果中脱颖而出——无论是经典的还是生成的(AI概述、语音搜索、Copilot、Perplexity)。

本地搜索引擎优化的好处

  • 提高本地搜索结果和Google地图的可见度-LocalBusiness架构可帮助将商家名称、地址、营业时间和位置与实际地点相关联。
  • 人工智能眼中的品牌信誉——一致的数据(在网站、谷歌商家资料、社交媒体上)确认了公司的身份并增加了人工智能模型的信任度。
  • 语音结果和AI概览中的存在–描述良好的数据使AI能够更轻松地推荐企业。
  • 更好地与用户查询保持一致–该架构可帮助AI了解做什么以及向谁提供服务,从而提高结果的相关性。

电子商务的好处

  • 由于丰富的片段(星级、价格、产品可用性和评论)提高了点击率,增加了Google上结果的吸引力,从而转化为更高的点击率。
  • 用户信任带来更高的转化率——有关评级、品牌和产品可用性的数据可以建立可信度并影响购买决策。
  • 提高AI推荐的可见性–生成式模型更有可能引用和推荐具有完整产品、优惠和评论架构的产品。
  • 利基品牌定位——即使是较小的商店,如果为人工智能提供完整且正确的结构化数据,也可以与大型平台竞争。

如何避免实体不一致和语义错误?

实体是人工智能模型使用的基本“意义单位”。每个公司、产品、个人或地点都是一个独特的实体,每个实体都应该被清楚地描述。当品牌数据分散、不一致或矛盾时,问题就会出现。

例:

  • 在网站上,LocalBusiness计划给出了地址1。
  • 在页面的页脚中有同样的地址2。
  • 以及Google商家资料–有同样的地址3。

对于一个人来说,这是一件小事。对于人工智能来说——三个不同的实体,所以三个可能不同的公司。因此,系统不知道哪些信息是正确的。

为避免这些错误,应该注意:

  • 关于公司名称、地址、税号、电话号码和所有平台上的网址的一致,例如网站、谷歌地图、LinkedIn、行业名录或社交媒体。
  • 在所有公司数据中使用相同的信息,以保持来源之间的完全一致性。
  • 为每个地点准备一组单独的结构化数据,而不是为不同的分支复制相同的信息。
  • 每次更改地址、品牌重塑或搬迁后定期更新数据,以避免搜索引擎和人工智能模型对品牌的解释不一致。

人工智能的工作原理是逻辑上的,而不是直觉的。如果某件事不是明确的,它就会将其视为不确定的来源。

通过结构化数据和语义链接建立源权限

人工智能背景下的权威不仅仅是链接的数量,而是实体的语义关联。

这意味着,如果页面、作者资料、公司和产品在schema.org上逻辑连接,人工智能就会将其视为一个有凝聚力的知识网络,而不是随机信息的集合。

语言模型形成了所谓的知识图谱,即概念、品牌和人之间的联系网络。对生态系统的描述越一致,人工智能就越有可能将品牌理解为可靠的知识来源,并在生成响应中引用内容。

有关人工智能结构化数据和可见性的常见问题(常见问题解答)

schema.org会影响AI概述中的位置吗?

在AI概述中可以更频繁地引用具有实施良好的schema.org的内容,因为模型可以更轻松地解释它,将其分配给正确的实体,并将其评为权威来源。

每个页面都应该有一个FAQPage部分吗?

不是每一个——但每个回答用户问题的人都应该这样做。Schema在教育、提供或指导内容中效果最好,其中实际上有问题和答案。如果添加的FAQPage没有问题形式的实际内容,Google可能会认为该数据是对架构的滥用,并忽略它。

错误的方案会损害内容的可见性吗?

架构中的错误(例如缺少必填字段、与内容不一致、数据过时)可能会导致整个标记被Google拒绝。更糟糕的是,反复出现的技术错误会降低网站在人工智能背景下的可信度,人工智能将此类数据解释为“不可靠的来源”。

示例:

如果产品架构列出的价格为249元,而页面显示为199元,则AI模型将认为数据不一致,并在生成推荐时跳过该页面。因此,每次部署或更新内容时,都应在Google富媒体搜索结果测试中验证架构,并在Search Console中进行验证。

llms.txt文件是强制性的吗?

llms.txt文件是OpenAI和谷歌正在研究的一项实验性标准,以允许网站所有者决定其内容是否可用于训练语言模型。

值得关注它的发展,因为在未来几年内,llms.txt可能会与结构化数据协同工作——确定生成模型可以索引和引用哪些知识。

结构化数据会影响点击率吗?

丰富的摘要(星级、定价、常见问题解答、产品可用性)可以提高给定搜索结果的点击率。

要记住什么–结构化数据作为SEO和AI之间的桥梁

结构化数据已成为现代搜索生态系统中可见性的支柱。Schema.org在今天不是一种选择,而是每个希望被搜索引擎和人工智能模型理解的品牌的义务。正确实施的模式会创建一个语义知识网络,使品牌不再是互联网上的匿名页面和可识别的知识单位。

数据一致性是成功的关键。人工智能不信任提供相互矛盾信息的来源。如果架构、社交资料和内容以一个声音说话,就可以建立数字信任。一个地址,一个名字,一个标志,一个品牌标识。在生成式人工智能领域,实体一致性是信任的新资源。

未来几年,schema.org将成为人工智能理解世界方式不可或缺的一部分。语言模型不像人类那样阅读内容,而是从关系中学习。如果网站具有逻辑描述、连贯性和语义连接,那么就会成为全球知识生态系统的一部分。这不再只是一场在谷歌中地位的争夺——而是一场人工智能理解的争夺。

在AI时代照顾好你的知名度

如果希望品牌被人工智能看到、理解和引用,请从基础开始。我们帮助公司实施结构化数据、建立语义一致性并提高AI结果的可见性。

👋 感谢您的观看!

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享