云南省人工智能重点实验室部分成果国内领先 自主研发系统可翻译108种语言

原标题:云南省人工智能重点实验室部分成果国内领先 自主研发系统可翻译108种语言

云南省人工智能重点实验室部分成果国内领先 自主研发系统可翻译108种语言

通过小语聊聊,不同国家的人能在平台上跨语言顺畅交流。

随着人工智能技术的发展,语音实时翻译转写已不再是难事。但目前市场上大多数设备和软件主要支持中文与英语、日语、韩语、法语等常用语言的翻译,而支持越南语、缅甸语、老挝语等非通用语言的翻译产品还较少,翻译效果不理想。针对云南的区位特点,昆明理工大学云南省人工智能重点实验室从南亚东南亚语言信息处理及机器翻译、语音识别及合成等方向开展研究,形成一支面向“两亚”语言信息处理的高水平研究团队。去年,该实验室入驻昆明呈贡信息产业园区,通过“语言技术+”应用和产业合作平台建设,研发成果不断转化并加速推向市场。

“实验室在语言技术方面的研究10多年前就开始了。”该实验室负责人毛存礼说,2005年,团队从资源建设等底层工作开始,研究起了语言转化技术,包括自然语言处理及机器翻译、信息检索与社会计算、语音识别与合成、图像识别与检索、机器学习与智能控制5个方向。

云岭机器翻译平台是实验室的核心成果,结合越南语、泰语等南亚东南亚语言资源稀缺的特点,团队提出一系列神经机器翻译方法,实现了中文与越南语、缅甸语、泰语、老挝语、英语、日语等108个语种的双向神经机器翻译,覆盖“一带一路”沿线多个国家。日前,“云岭翻译”服务板块正式上线“一部手机办事通”,成为平台首家上线的南亚东南亚语言翻译工具。

“今天的天气真好”“准备开会了”“我们聊一聊”……11月11日,研究人员手拿一台翻译设备持续输入普通话,几乎是同一时间,另一台设备上就出现了对应的越南语文字。这便是小语洞听同声翻译软件。基于先进的深度全序列卷积神经网络模型,该软件构建了实时语音识别引擎,可以将采集到的音频实时转化成文本并进行翻译,识别准确率高、速度快。

同时,基于文字翻译技术,团队向多个方向拓展,针对日常交流、会议、社交等场景,上线了小语洞听、小语聊聊等系列产品。小语聊聊集成自主研发的东南亚语言翻译、图像OCR识别、语音识别及合成等核心技术,不同国家的人能在平台上跨语言畅通交流。小语译制可实现中文到越南语、泰语、缅甸语等东南亚语言的字幕自动译制,投入使用以来已译制上百集电视剧。小语悦读采用深度学习技术构建端到端语音合成引擎,输入的文本可自动转换为语音。“为了提高声音输出效果,不同地区、民族的语言均为当地标准口音,现场录制后用机器训练合成模型,准确率高且接近真实人声。”毛存礼说。

除了文字、语音识别翻译,图像识别也是实验室研究的方向之一。结合输电路巡维智能化需求,实验室研发的输电线路缺陷智能识别系统支持输电线路图像质量判断、低质量图像高清化、图像内容校验,完成绝缘子自爆等20余种缺陷的智能标注和识别。毛存礼表示,和传统人工巡检相比,智能识别系统只需根据图片就能作出正确判断,不仅确保了工人的安全,也提升了巡检水平。

目前,云南省人工智能重点实验室已获国家新一代人工智能专项、国家自然科学基金重点项目等国家和省部级项目60余项,构建了面向南亚东南亚语言的大规模双语词典、平行语料等资源库,以及面向南亚东南亚语言分词、词性标记等语言解析平台。接下来,实验室将主要开展翻译机系列产品升级、定制化系统部署、翻译接口服务等方面工作,力争突破语言技术,推动面向“两亚”的数字经济先行示范区建设。(记者 张怡 实习生 张瑞东摄影报道)

来源:昆明日报

大观网-36氪的头像大观网-36氪
Previous 2024 年 6 月 25 日 上午9:29
Next 2024 年 6 月 25 日 上午9:38

相关推荐