千支队伍挑战中文NL2SQL 院校与企业参赛者各半

2019-08-21 16:18:40 来源:Donews
        【每日科技网】

  近日,由追一科技主办的首届中文NL2SQL挑战赛初赛结束。来自海内外的1457支队伍,经过1个多月的初赛角逐,决出30强队伍。来自国防科技大学、北京交通大学、国双科技、清华大学、哈尔滨工业大学等高校、企业的30支优胜团队,晋级下一阶段复赛挑战。

  此次比赛,也是中文NLP领域举办NL2SQL主题比赛,并发布相关数据集,引起了业内和海内外广泛关注。自6月24日比赛启动以来,共有1457支队伍、1630名选手报名参赛,参与院校数达170所,其中227支队伍、318名选手提交成绩。广泛的参与,使得NL2SQL成为国内NLP技术比赛领域参赛规模的赛道之一。

056759b88dbdcfbb578f68b2f207cb4c.jpg

  挑战中文数据集

  值得注意的是,本次比赛提出的NL2SQL中文数据集比英文数据集WikiSQL引入了口语化表达、结合表格内容、命名实体链接、更复杂的SQL语法等挑战,难度更高的同时也更贴近于真实应用场景,但在选手们的积极、多方探索下,短期内就已经可以达到与英文数据集上相当水平的分数。

  近两个月的初赛过程中,选手们的方案一直持续刷新着本次比赛的新记录。

fc98398fcb5aab83e20a0d336463c17e.jpg

  比赛初期,排行榜头部选手们的分数聚集在0.58左右,已经超过了比赛方所提供的baseline。随后,选手通过各种讨论、交流,加深对数据集理解,不断探索更优的方案,从而提高成绩,头部选手的分数很快突破了0.80大关。在8月12日初赛结束时,比赛榜上的头部分数已经达到0.89,已经接近WikiSQL的成绩。

  比赛成绩的快速提升,充分体现出选手们的投入与方案的,同时也侧面反映出,目前积累的许多技术方案都可以在NL2SQL这一个新任务上发挥作用,大家也意识到,只要有充分的数据来支撑, 目前人工智能领域的方法论可以有效地为数据库乃至结构化数据提供自然语言的交互方式。

  千支队伍挑战NL2SQL

  任务上的创新、应用上的潜力,NL2SQL比赛一经推出,就受到了学界和工业界的广泛关注。

  据了解,本次1457支参赛队伍中,院校和企业参与者各占“半壁江山”。其中,学生及科研人员占比48%,企业技术员工占比52%。学生参赛队伍来自众多知名院校,如北京大学、清华大学、复旦大学、上海交通大学、南京大学、浙江大学、中国科学技术大学、哈尔滨工业大学、西安交通大学等。

  虽然本次比赛的数据内容是中文形式,但仍然吸引了美国、英国、新加坡、日本、澳大利亚、加拿大等海外院校参与,包括卡内基梅隆、墨尔本大学、新加坡国立大学、南安普顿大学、新南威尔士大学、布里斯托大学、昆士兰大学等。

  作为新兴NLP研究任务,NL2SQL在专业难度上,也对选手提出较高要求。据了解,本次参赛选手中,硕士及以上学历占比57%,其中,博士学历占比6%;而专业分布上,计算机科学专业背景的选手则属于参赛主力。

  应用潜力吸引名企参赛

  值得注意的是,NL2SQL挑战赛,还吸引了众多的企业技术人员参与。

  来自中国移动、平安集团、搜狗、达闼科技、中兴通讯、网宿科技、国双科技、捷通华声等众多企业的技术人员,也成为参赛队伍的重要力量。

  “此次挑战赛参与规模远超预期,显示出NL2SQL在学术和工业应用上的潜力,数据库的交互创新,正在受到越来越多关注。”追一科技联合创始人兼CTO刘云峰博士表示,追一科技将与更多院校、企业界同仁携手,共同推动中文NLP研究与应用突破。

  据了解,中文NL2SQL挑战赛复赛将于8月19至9月9日进行。复赛阶段采用线上运行的方式来进行评测,测试集不可下载,并且内容对选手不可见。同时,测试集在保证数据分布与初赛测试集一致同时,加入更多在初赛中没有出现过的表格数据,届时,将对选手方案提出更高挑战。而复赛胜出者,将会参加10月份的最终决赛。

免责声明:本文仅代表作者个人观点,与每日科技网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
    本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.

猜你喜欢

智启车展新篇,解构新时代驾乘体验 哈曼创新科技赋能车内体验升维

2025年4月23日,第二十一届上海国际汽车工业展览会盛大启幕,本次车展以“拥抱创新共赢未来”为主题,集齐了全球各大汽车行业巨头的前沿科技与创新成果,共同描绘未来智能出行与绿色生态的蓝图。作为汽车科技

2周前

移动云:以“AI+”力量重塑中小企业数字化未来

数字化转型,是中小企业在新时代背景下的“必答题”。连续两年的政府工作报告提出,加快传统产业和中小企业数字化转型,深入开展中小企业数字化赋能专项行动。《中小企业数字化赋能专项行动方案(2025—2027

2周前

奥维云网二手房数据,助力“以旧换新”政策下家电企业抢占先机

在“双碳”目标和消费升级的行业背景下,中国家电家居行业正迎来以“以旧换新”为核心的政策红利期。2024年国务院明确提出推动消费品以旧换新,家电、家居产品成为重点领域。而这一政策的落地,与存量房市场(二

奥维云网

2周前

华为世界地球日短片发布,快去开启“与地球和鸣”的空间音频之旅吧

清晨被闹钟叫醒,夜晚伴着车流入眠……声音,是我们对这个世界的“第一印象”。然而,在这些日常的喧嚣之外,远方的原野则在发出动人的“天籁”。4月22日世界地球日,华为发布「与地球和鸣」主题纪录片,可在华为

华为

3周前

AI算法+硬件堆料,终结拍鸟技术痛点的佳能专微系统

拍鸟正成为当下热门的摄影题材,我们手中相机也加入了各种便利的人工智能功能,让拍鸟变得更加方便。像是佳能EOSR5MarkII和EOSR1的鸟眼识别追踪、预连拍以及机内AI超分辨率与神经网络降噪都是生态

3周前

权威认可!小天鹅荣膺奥维云网三项行业大奖

作为家居产业第三方数据代表,奥维云网(AVC)一直以来是整个泛家居行业发展的见证者,在不断深耕独特业务场景和数据特征过程中,助力家居企业更快响应市场变化,推动行业创新发展。近日,小天鹅品牌接连斩获由奥

小天鹅

3周前