“显微镜”式营销洞察背后的黑科技( 二 )


在巨量引擎 , 机器的文本理解水平已经精确到了词粒度 , 达到了目前语义理解的最小单位 。 简单来说 , 技术同学会制定一套具备商业属性的关键词策略 , 例如语义上是否相关、词频高低、热度搜索趋势、数据源是否有商业属性等 , 机器会根据这套策略将识别到的词语按照关键程度进行排序 , 越符合规定策略的词则排名越高 , 最终被定义为商业关键词 。 这些商业关键词如果再经过系统的“美工” , 就是我们在分析中经常看见的词云图 。
2. 更广泛的内容识别范围
对机器来说 , 视频通常集图像、音频、文本等各个形态于一身 , 所以识别难度也比文本更高 。 在技术领域 , 通过机器学习的方法实现和理解多种形态信息的能力称为多模态学习 , 这其中“模态”就是指各种信息的载体 , 如文本、图像、声音等 。 因此 , 视频理解就是一个典型的多模态学习应用场景 。 通过“多模态学习” , 机器能够识别出更多数据形态 , 对内容的理解也会更充分 。
整体而言 , 让机器理解视频主要分为表征、融合和分类三个步骤 。
“表征”的作用类似于翻译 , 即将文本、图像、声音等不同类型的数据转换成机器能理解的“数据语言” , 即同一种结构的数据 。 在“融合”阶段 , 机器将采取不同的策略将多种模态的信息进行整合 , 寻找这些信息之间的关联性 , 形成统一的认知 。 最后 , 机器在充分理解之后再把数据按照一级、二级行业属性等规则进行归类 , 相似的数据归为一类 , 最终输出“标签” 。
多模态技术科普视频:机器是如何理解视频的?
通俗来讲 , 有了多模态技术的加持 , 就像人类掌握了多国语言 。 一方面 , 在缺失某种模态的情况下也能凭借另一种模态理解内容;另一方面 , 通过对不同模态的信息进行融合 , 机器对内容的理解也更加准确 。
通过对文本与视频的理解 , 机器将底层庞大的内容流“划分”成了各式各样的标签 , 这些标签中有相对粗粒度的类目标签 , 也有精细到词粒度的关键词 , 它们组成了庞大的商业标签库 , 成为满足广告主不同营销需求的底层基础 。
三、应用层:高效满足个性化洞察需求虽然通过内容理解技术 , 机器最终能够输出更精准的标签 。 但这些标签属于标准化产物 , 产出后无法再更改和调整 , 因此依然很难满足一些广告主的个性化需求 。
例如 , 如果广告主只想投放对自己品牌感兴趣的人群 , 或仅想知道与自身产品相关的利益点分析 , 那么就需要重新生产出一套符合自己需求的个性化标签 , 这其中需要对标签进行定义、根据规则在底层数据库中进行挖掘、以及评估测试等多个流程 , 最后才能上线使用 。
这一系列流程都是在标签平台上实现的 。 简单来讲 , 标签平台是搭建在内容理解的能力基础之上的标签生产和管理工具 。 通过一套标准化的流程 , 让不懂技术的业务同学也能够根据实际需求自定义标签规则 , 在平台上灵活生产标签 。 后来标签平台经过内测后对外开放 , 在巨量云图上线为“标签工厂” 。
用技术同学的话说 , 标签平台的价值就像是将餐厅的后厨开放出来 。 如果菜单上没有符合客人胃口的菜 , 那么就可以直接去后厨 , 挑选合适的食材 , 做出想要的美食(标签) 。
一言以蔽之 , 标签平台让精准洞察具备了“适配性”:不仅精准 , 且为广告主真正所需 。
最终 , 通过内容理解和标签平台 , 广告主才能通过对全平台的内容指标分析 , 看到各种品类的市场趋势 。 甚至还能通过分析某一特定品类的UGC及PGC内容 , 得知产品卖点与用户认知是否契合、正负评论各有哪些、产品利益点表现情况等 。


特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。