但存在的一个问题是, 我们设计的审稿规范, 不能保证审稿人能够严格按照规范去操作, 这方面还需要去持续优化 。
AI科技评论:今年字节跳动的一篇ICLR拒稿投了ACL, 成了最佳论文, 您如何看待这种“转投中稿”的现象?NLP领域四大顶级会议, 学生应该如何选投, 能否给出一些建议?
很多人知道NLP领域有四大顶会ACL、EMNLP、NAACL和COLING 。 ACL是公认综合质量最高的国际计算机语言学会, 语言探索与经验方法兼容并收 。 COLING与ACL类似, 是历史悠久的NLP学术会议, 但不属于ACL协会旗下 。 NAACL偏重数据驱动方法, 与EMNLP风格接近, 更符合美国学者的口味 。
早期整个人工智能, 包括自然语言处理都不是很火热, ACL每年只有几百篇的投稿量 。 后来, 基于规则的机器学习方法开始出现, 自然语言处理领域才开始活跃起来 。 SIGDAT是ACL协会下设的一个语言学数据工作组, 他们建议创建一个自然语言处理经验方法会议, 也就是EMNLP 。
EMNLP对经验方法的定义, 包括模型设计和实现, 语料库构建与标注, 还有评价方法 。 所以定量实验和数据分析, 做得多做得好, 更容易受到EMNLP认可 。 我们今年评选的最佳长、短论文都与数据集有关 。
虽然会议在定位和设计上各有特色, 慢慢还是会出现一些同质化的倾向 。 因为除了COLING外, EMNLP、ACL和NAACL都是由ACL组织运作的, 审稿人、SAC/AC、PC基本来自于同一个群体, 各会议在审稿要求和规范方面也会相互参考和借鉴 。 所以学生在投稿的时候, 不见得要紧盯一个会议, 在DDL之前所有NLP相关会议都可以去尝试 。 对于初次投稿的学生来说, 这个过程中收到的反馈和意见更重要, 字节跳动“转投中稿”的事也印证了这个事情 。 另外, 现在NLP的投稿量越来越多, 有了idea和好结果再不投, 可能就被别人抢先了 。
AI科技评论:EMNLP被拒论普遍存在共性问题是什么?您认为真正好的论文应该具备哪些特质, 能否给学生一些建议?
整体来看, EMNLP投稿论文的下限相比以前有所提高, 因为提交格式不规范被拒的情况少了很多 。 现在存在比较重要的问题是:过于关注SOTA 。 很多作者觉得只要我的模型有好的结果, 上传了coding, 就可以发表了 。 但对于一篇真正好的论文来讲, 模型性能只是一方面 。 我们更关注的是作者的研究动机, 文章的论证逻辑, 以及实验方法的新颖性 。
作者要明确地提出科学问题和解决方法, 在这之前, 他们需要做好充分的文献调研, 我们发现, 很多作者提出的实验方法其实早就被验证过了, 所以研究的创新性、新颖性是很关键的 。 我们还要看作者的逻辑表达, 是否能把以往的工作梳理清楚, 从分析、研究到验证的整个过程是否严谨, 有理论支撑 。 另外, 在实验环节, 我们不仅看实验结果, 更关注设计过程是否合理, 实验结果是否充分可靠 。
我经常跟自己组里的学生说, 不要觉得科研论文是记叙文, 写在叙事 。 既然是“论”文, 就一定要以说理为主, 要以理论和实验为依据, 在有限的篇幅内把研究观点立起来 。 实验只是验证结论的一个手段, 不能只关注SOTA, 从发现问题到解决问题的逻辑演绎更为重要 。
AI科技评论:EMNLP获奖论文是如何进行评选的, 今年评选过程中是否有一些有趣的故事?
其实获奖论文评选工作在初级审稿阶段就已经开始了 。 审稿人、领域主席到高级领域主席都会在审稿表单中推荐最佳论文、, 这些建议会提交给我们进行二次筛选, 差不多筛选出一半后再提交给最佳论文评选委员会, 由他们做最终的决定 。
- 老师发的金山文档怎么填写? 金山文档小程序怎么发到群里
- 对话百胜软件创始人黄飞:零售内卷期,谁来拯救同样疲惫的商家?
- 孙嘉接任万科海外主席 如何避免边缘化?
- 在元宇宙里怎么交朋友?Meta发布跨语种交流语音模型,支持128种语言无障碍对话
- 云南将通过微信小程序、支付宝和京东App发放1亿元“彩云消费券”
- 市场要闻丨鲍威尔再获美联储主席提名,美股大型科技股普遍走弱
- 美团公开“应用程序测试方法”专利
- 高通CEO安蒙当选美国半导体行业协会轮值主席
- 再现传奇!周大福携手电影《梅艳芳》,打造跨时空“对话”
- 新东方在线获主席俞敏洪增持142.9万股 持股比例上升至4.77%
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
