请在Chrome、Firefox等现代浏览器浏览本站。另外提供付费解决DEDE主题修改定制等技术服务,如果需要请 点击 加我 QQ 说你的需求。XML地图

极客邦科技专访腾讯小知美好文章陈松坚:知识表示是NLP乃至AI进展的瓶颈

NLP 好文章美文 评论

北京2018年12月27日电/美通社/--极客邦科技主办全球人工智能与机器学习技术大会--AICon2018,会上专访了腾讯数据平台部高级算法研究员陈松坚,与大众分享NLP的发

  北京2018年12月27日电 /美通社/ -- 极客邦科技主办全球人工智能与机器学习技术大会 -- AICon 2018,会上专访了腾讯数据平台部高级算法研究员陈松坚,与大众分享 NLP 的进展瓶颈以及当前技术研发趋势。

腾讯小知

腾讯小知

  人工智能领域有这样一句名言:解决了 NLP 的困难,也就解决了 AI 领域80%的题目。从对话机器人 Eliza 开始,人们就对“会说话的机器”出奇的着迷,跟着人工智能技术的提高,越来越多的人投身天然语言处理(NLP)的研究中,为了开辟出智能、易用的对话机器人而不懈努力着。

  几个月前,AI 前线策划了一篇文章,题为《都说聊天机器人已死,为什么腾讯还要打造自己的智能客服?》,在这篇文章中,曾深入讨论过智能客服/问答产品和 NLP 技术的技术难点、解决思路、贸易化落地的途径和未来进展,在极客邦科技主办的全球人工智能与机器学习技术大会 -- AICon 2018上,极客邦科技有幸再次专访到腾讯数据平台部高级算法研究员陈松坚,除了对他本人的技术研发之路有了更深的了解,陈松坚也分享了良多有关 NLP 进展瓶颈以及技术趋势的看法。

  入坑 NLP,一不小心深耕十年

  天然语言处理被称为人工智能皇冠上的明珠,为了它,无数研究职员为之辛勤钻研,陈松坚就是这其中的一员。2009年,仍是研究生的陈松坚选择了 NLP 作为自己的研究方向。为了这个选择,他与自己作了一番斗争。

  从当时比较现实的角度看,算法兴许更好就业,于是陈松坚选择了机器学习、NLP、计算机视觉、数据挖掘等几个方向作为备选。至于为什么终极选择 NLP,陈松坚说,主要是由于考虑自己当时对搜索引擎比较关注,尤其是智能搜索技术;而从理想的角度想,他说自己从小比较喜欢机器人,向来有个梦想开始建筑自己的机器人系统,而 NLP 是其中的不可或缺的部门,于是也就天然地做出选择了。

  兜兜转转过了十年,陈松坚也早已成长为一名专业的研发职员,但是手里的工作仍是转回到了 NLP 相关的项目上来 -- 即腾讯小知,他开玩笑的说:兴许是内心的召唤让自己重回智能对话这个研究领域。

  腾讯小知是如何炼成的?

  对于大部门对话机器人的研究职员来说:人类如何产生认知并且与外部进行交互是一个永恒的课题,对于陈松坚来说天然是不例外,他以为:深度学习的兴起使得语音和图像识别的错误率大大降低,感知的题目得到了很大程度的解决。但是认知的题目,目前可以说还没有本质上的提高,原因就是那个永恒的课题。

场景演示

场景演示

  “语言是思维的外化,研究语言的理解和产生,就是想借此推动认知智能的进展。”陈松坚增补道:“固然这需要一个迭代的过程,也需要一个场景去实践和落实这些设法,于是我们选择了智能客服这个贸易场景,去打造企业服务中的智能问答服务,输出价值。”

  陈松坚说,智能问答中有许多方面都可以进行深入研究。

  好比,基础层可以做深度语义匹配模型核心组件的进一步优化,还有开辟问答拒识模型,用于过滤当前问答库无法回答的题目;应用层可以做强化学习在多轮任务机器人的应用,主要用于进行对话策略的在线学习。目前腾讯小知团队已经成功开辟了若干个特定任务的 demo,正在预备正式部署到线上使用。

  说回陈松坚深度参与的腾讯小知项目。

  腾讯小知是从去年7月开始启动研发的智能客服系统,经历1年多的核心功能打造,现已落地多个应用,日均回答百万量级。在之前的采访中,陈松坚曾说:腾讯小知目前落地在政务、零售、服务等多个行业,上线时间仅2个月,已落地了数套成熟行业解决方案,成长势头很好。

  虽然长势喜人,但说起腾讯小知的成长历程,陈松坚仍是发出了一声感叹:万事起头难。

  他解释道,在腾讯小知刚起步的时候,团队里对深度匹配模型的经验较少,而又因为业务上线的进度比较紧迫,因此选择双线作战,一边开辟基于传统机器学习模型(xgboost)的线上系统,另一边进行深度语义匹配模型的论文复现、调优和工程实践。

  考虑到 SaaS 场景下用户能够提供的练习语料非常欠缺,陈松坚和团队因此特意引入了迁移学习的策略来对应解决语料不足的题目。事实证实这些安排和策略都取得不错的效果。

  能够带领腾讯小知的算法团队,从零开始一步一步地建设这种面向行业的智能问答解决方案,让陈松坚倍感欣慰,一方面需要快速响应业务的需求,快速实现和上线新功能,切实解决客户提出的题目;另一方面又必需紧跟业界和学界最新的技术,并积极寻求实施落地的路径,陈松坚说,从个人角度来说,这是最有成就感的事情。

  从业近十年,陈松坚也积压了大量的实践经验,在采访中他也绝不吝啬地将这些经验分享给了有同样困扰的开辟者:

  他以为对于开辟者来说,首先,“要尽早搞清晰业务的需求” ,不同行业的问答解决方案很可能会涉及到不同的技术点,而且不同的业务场景对正确率指标的要求也不一样,这个也会影响算法落地的侧重点。好比腾讯小知最早接入的公安行业,知识库就特殊复杂,分支前提许多,因此需要大量使用知识图谱来补全 FAQ 机器人的问答死角。

  第二,“要留意测评数据集的正确构建,尤其是线上环境的测试数据的收集” ,需要保证线下实验能对齐模型在线上环境的效果。另外就是跟业务关联的评价体系的构建,这样才干朝着准确的方向,稳定地迭代优化。

  NLP 如何突破瓶颈?

  智能客服长短常综合的 AI 系统,几乎涉及 NLP 领域所有技术点,甚至还包括语音和图像的处理。但人们对技术往往短期期望过高,而长期期望过低。虽然近年来 NLP 应用,尤其是翻译、写作、对话机器人等,在模型增强和知识图谱建设完善的过程中,在特定的场景下,满意了大部门人的使用需求,但是,在陈松坚看来,NLP 仍有一些瓶颈题目需要解决。

场景演示

场景演示

TAG: 警察的好文章 陆谷孙好文章 写好文章有哪些好方法 关于钢厂安全的好文章 说话难听人很好文章 可以分享的好文章 在哪里才能看到好文章 谚语开头的好文章 政协好文章 各种好文章的结尾 好文章怎么赞美 对学生有启示的好文章 关于坚持的好文章 免疫荧光 发好文章 护理新三好文章 健身好文章 适合朗诵的好文章 过年一家团聚的好文章 好文章模板 记事好文章
喜欢 (0) or 分享 (0)
发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论