主页 > www.99011m.com >
浅谈:YY直播平台中内容分发、自然语言对话NLP的人工智能AI
发布日期:2019-08-13 08:09   来源:未知   阅读:

  本文是关于在直播平台中内容分发、自然语言对话的人工智能AI应用。主要侧重其定义、作用、实现方式,同时也抛出相关的资讯及案例进行分析。这也是当时面试欢聚YY AI产品经理其中六轮面试中第三轮中一些问题的梳理总结,后面拿下了这个Offer。(由于利益关系去掉了一些内容)对AI产品经理的相关面试和准备有兴趣的小伙伴,欢迎关注收藏,不断更新。

  违规的直播有多种类型,如涉黄、广告、侵权、赌博、暴力、政治、敏感、屏中屏等,人工以或标准化的审核模型难以精准识别,误判、漏判的概率较高。

  监管要求24小时实时进行,虽然违规比例占比不高,但为了做到“无漏网之鱼”,需要投入大量的人力、物力和财力进行监管,运营成本压力增加。

  夜晚疲劳,人眼识别精确度降低,出现误判漏判的概率上涨,审核效率降低,难以达到网络直播的内容监管需求。

  一是主播注册的实名验证,若完全依靠人力审核,人力成本增加,难以做到真实有效的审核;二是每次主播直播时,都验证是否属于本人在直播,这又增加一部分人力成本,运营难度上升。

  网监建立存储违规图片、视频的MD5数据库,用户上传后自动分析MD5是否合法,则可避免涉黄内容重复分享。

  如识别色情图像,基本是通过图片 RGB 值识别肤色比例;通过建模识别异常动作、敏感部位等。

  这些审核方式都存在较大的漏洞。“三班倒”的人工容易导致审核效率低、误判漏判多等主观性问题;MD5则非常容易被篡改;传统智能识别色情图片准确率低、经常误报等。同时,对近两年热门的视频直播审核需求更难以满足。

  (2)场景:如举例“鉴黄”:通过鉴黄模型对内容分析的类型为“色情”、“性感”和“正常”三类,并且机器会自动将识别结果分为确定和复审两部分,确认部分的识别精确度达到或超过人工,无需复审,对于复审部分,机器会根据可能性排序,人工再根据概率从高到低来审核。

  大数据时代,对于电商、内容型产品,个性化推荐已成标配,应用好处不多复述。此处的内容分发,侧指的是前端的个性化内容排序,即个性化推荐。

  目前主流的推荐算法是协同过滤,推荐引擎是多种推荐算法组合的。此处也不对算法层面过多开展,侧重关注的是:

  因此,如何识别出内容的特征,是影响着个性化内容分发的效果、效率、体验。

  此处只针对视频直播进行分析。利用AI技术从人脸、图像、音乐和语言四个维度对视频直播进行分析和理解,可以对其做出基本的分类,特征化。

  首先,按上述特点,应对视频直播的内容按多种维度划分,利用AI对内容识别,挖掘出丰富内容特征。其次,

  最后,可以考虑一种的个性化内容分发是:用户特征+主播特征,进入推荐引擎计算,召回一批符合用户偏好的“主播权重列表”。此时再去查询这些主播是否有开直播、直播开始多久了、亲密程度等等维度进行综合推荐,以达到个性化内容分发。

  风格:一个喜欢做嘟嘴表情的年轻女主播,会有很大可能被打上“萌妹子”的标签(人脸识别);

  个性化的内容分发,可以用于多个场景,如搜索结果页、首页、关注页等,基于不同用户分群进行个性化推荐策略。此外,除了在内容特征识别应用AI,在推荐引擎中的深度学习、知识图谱也是AI在支撑。2. 自然语言对话在直播平台中的AI应用

  首先,NLP涉及领域很多,凡是有自然语言(语音、文字)输入的场景,都有可能会使用到。如语义分析、机器翻译等。

  其次,若按对话的场景区分有:封闭域对话、开放域对话。通俗的说,前者是”要求用户输入指定地话语才能继续对话”,输入输出是可枚举的、有明确始与终;后者是“用户爱说什么就说什么都可以持续对话”,输入输出无法穷尽、无明确流程。若按对话内容方式有:文字、语音。(一般情况下,文字可以直接处理,如果是语音,通常情况下需要将语音转换成文字(ASR技术)

  一般原理是:是用户输入,引擎内部通过长期积累的知识,首先经过自然语言分析,在通过语义理解、上下文分析进行知识推理,从而生成个性化的答案,输出给用户。整个典型的自然语言对话如下图。

  基本原理是:输入的是用户的问题,引擎内部通过长期积累的知识,首先经过自然语言分析,在通过语义理解、上下文分析进行知识推理,从而生成个性化的答案,输出给用户。整个典型的自然语言对线 现状

  从输出方式来看有:文字输出、图像输出、语音输出。这个类型视业务需求、产品场景所决定。目前客服机器人主要是文字输出,一般基于用户画像预测问题、热门问题前置等。

  问答机器人其实是在头部问题上实现了综合过滤,然后通过对话的形式反馈给用户,如果用户实在问的是长尾问题,问答机器人回答不了的,此时可走人工客服。满足了用户九成以上问题的直接答复,是问答机器人的核心目标。满足在服务上,缩短服务寻求路径与服务寻得率,从而提升用户自助体验,降低人工入线率,降低运营成本。

  举个例子如下图,JD客服JIMI机器人增加情感分析,从IQ到EQ的升级,用户体验上是有明显差异的:

  此外,增加情感分析也可用作对话质量(服务)评估。如根据前来咨询的客户来时的情绪,以及离开时情绪的对比,就能从另一个维度感知此次服务的质量。既可以用以考核客服人员,也可以用来改进客服的服务。

  不能以对话轮数多少相比。比如,人类用户与小冰的平均每次对线轮,微软对此也颇为津津乐道,但是,在客服上,如果机器人要与前来咨询的客户对线轮,才能给出答案,你可以想象客户的反应会是什么。

  相比较于客服机器人,语音助手更是起到连接、推荐作用。用户通过输入语音或文字,可调用直播平台内各项功能、服务。整个对话过程是类似开放域的场景。

  如猜你喜欢什么主播或直播,那么助手对话过程的引导可以有多种,或许通过用户自拍、发送某些图像信息等,给出相应趣味的关联分析,如性别,年龄等,以此提供个性化推荐服务;

  自古民间出高人。对于直播的平台是欢迎各大IP入住开播,主播也乐于展显看家本领。而直播更具强调互动性,直播过程中需要通过言语肢体等与粉丝互动,其中,言语表达尤为基础重要。

  有一类人,他们身患绝技、各怀才艺,却有表达缺陷,如哑巴。在如今强调人人是IP、自媒体的时代,他们可能因此而失去一些做主播的机会。

  但是,他们本身是懂表达,如唇语、手语。从本质上,一切人类沟通的语言都属于自然语言。因此,能利用AI的技术手段进行识别、跟踪,通过NLU进行理解、翻译,最后输入语音表达。

  同时,若声音实现不理想,也可以将唇语或手语识别进行文本翻译,也是一种互动方式。

  直播过程中或许存在一些语音不可用的场景,如噪音突然变大、摄像头未配备麦克风(损坏)。这时,若主播调用唇语识别功能,基于以上原理能保持直播间互动正常,避免突然冷场中断、离场等情况。

  场景:针对现场直播解说类,为主播解说提供辅助。如,体育、游戏等竞技类的比赛直播。这里的辅助有4个方面:

  针对直播视频的信息:能实时提取一些相关的信息。如动作、球员信息,能够识别并输出文字记录,类似对话模式,或许可以供主播对大盘比赛有参考;

  如某场球赛直播,在视频中进行识别,如球员头像、动作行为、跑动轨迹等特征,再用语音的方式来为用户解读比赛进程,提供精选球迷评论、分享球星趣事等; 或许用户还可根据兴趣选择喜欢的球星观看,让虚拟主播成为自己专属的机器人解说员。

  最近对AI进行学习了解,包括从概念知识、应用领域、AI产品经理的相关工作流程等方面。同时参阅其他资料信息,对于AI PM有一些看法总结,其中这些也是和传统PM差异点:

  这里的现状,侧重是指技术原理、边界。每一项技术都有边界和最优应用场景,尤其目前AI技术相对是不够成熟的,那么了解好技术可能实现的能力范围、所需的成本、当前存在的技术瓶颈,具备这些基础会更好去沟通、发散和结合。

  正如上述所言,理解技术优劣势的基础上,寻找到可以提供更好用户体验的业务场景。也就是说,

  如何结合当前现有AI技术与业务场景,为用户提供更好更便捷用户体验的产品。

  因此其中主要的工作就是:完成当前技术与现有市场需求的映射,侧重对场景的思考。

  当前AI技术的实现成本相对还是高。也并非有想法就能实现,即使条件+成本都能满足时,也存在较大试错风险。因此还需对场景多思考,充分评估产品定位、用户价值、成本、商业价值等因素是否相匹配。

  互联网PM可能会深入关注局部业务范围的产品优化与用户价值,而AI产品经理可能需要在基于公司业务的整体范围,寻找存在AI优化的场景需求。

  机器学习促进了语音识别技术的发展,也促进发展了语音交互场景。AI语音交互的设计可能比手机/PC端的交互设计难很多,因为语音交互系统不是限定好的GUI操作界面,而是不便于规范且自由延展的自然语言。会话的开放性意味着 AI 交互设计者必须考虑用户可能采取的几乎无数的选择。要能够理解用户,了解他们的动机,然后合乎逻辑地思考如何引导他们完成一件事情。

  机器学习的理解、算法模型优化等等。(码字不易分享可贵!欢迎关注收藏后续再更新.)

  本文由 @凤城狂客 原创发布于人人都是产品经理。未经许可,禁止转载题图来自 Pexels,基于 CC0 协议

  竞品分析:学而思网校 VS 有道精品课 VS 猿辅导,在线教育赛道谁将脱颖而出?

  人人都是产品经理(是以产品经理、运营为核心的学习、交流、分享平台,集媒体、培训、社群为一体,全方位服务产品人和运营人,成立8年举办在线+期,线+场,产品经理大会、运营大会20+场,覆盖北上广深杭成都等15个城市,在行业有较高的影响力和知名度。平台聚集了众多BAT美团京东滴滴360小米网易等知名互联网公司产品总监和运营总监,他们在这里与你一起成长。