首页 > 综合信息 > IT业界 > 正文

字节跳动机器翻译技术论文获 ACL 2021 年度最高奖项,中国团队第二次

        【每日科技网】
每日科技网

  8 月 6 日消息 今日字节跳动官方宣布,8 月 5 日,国际学术会议 ACL 2021 正式颁发了大会奖项,字节跳动 AI Lab 的机器翻译技术论文当选今年度“论文”。这是 ACL 成立 59 年以来,中国科学家团队第二次赢得奖项。此前由中科院计算所主导的研究项目曾被评为 ACL 2019“长论文”。

  官方表示,ACL 2021 由国际计算语言学协会举办,是自然语言处理(NLP)与计算语言学领域级别的学术会议。本次共有 3350 篇论文参与评选。除了字节跳动,华为、腾讯、谷歌、微软、亚马逊等科技公司也投递了论文。

  自然语言处理被看作是“人工智能皇冠上的明珠”,在机器翻译、搜索引擎、信息流、输入法等领域有着广泛的应用。词表是自然语言处理的基础组件,与词典索引类似,词表预训练模型往往需要耗费大量的时间和能源。

  在这次 ACL 2021 获奖论文中,字节跳动技术团队提出了“面向机器翻译的运输词表学习方案”(Vocabulary Learning via Optimal Transport for Machine Translation,简称 VOLT)。研究人员用经济学领域的“边际收益”定义了词表质量的评价指标,然后以数学领域的“运输方法”解决词表的生成问题。

  研究结果显示,VOLT 在多种翻译任务上取得了出色的效果。同时,这种方法可以显著减少词表的学习和搜索时间,节约算力资源。

  业内普遍会通过大量自然语言处理下游任务的训练以寻找大小,使用 BPE 词表的方式。而字节跳动使用的 VOLT 方法,能够节省 92% 的算力,这同时意味着所需电能的大量减少。巧合的是,这一技术的缩写“VOLT”同时为电学单位伏特,未来能够在工业应用上有巨大潜力,有助于节能减排。

  字节跳动表示,目前,VOLT 研究项目已经向全球开发者开源,并将在字节跳动火山翻译业务中逐步落地,为飞书、今日头条等产品和火山引擎的企业级客户提供机器翻译支持。

免责声明:本文仅代表作者个人观点,与每日科技网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.