万里旅行网

在未来 5 年,语言学领域可能出现哪些新变化和新趋势?

来源:www.wlogo.net   时间:2023-03-24 00:38   点击:172  编辑:yyns   手机版
我也不知道为何这几天陆续有人邀请我一个知乎小透明来回答这样一个宏大的问题。
"语言学领域"真的好宽泛的,我自己也并不完全做语言学,技术方向也没学好,读书还少,大概上来瞎说一点跟我方向较为相关的句法语义及工作相关方面的可能吧,算抛砖引玉了,欢迎批评指正、交流,人身攻击请免开尊口:

首先,理论语言学内部发展的力量将在更大程度上受到技术发展力量的冲击,技术发展的水平及需求会倒逼语言学理论转变研究问题的视角,而技术发展同时也会提供新的研究方法。

传统句法分析往往从单句入手,静态地描写成分、结构层次、关系,无论是词汇层面还是句法结构、关系层面,最后一批矮处的果实也已经被50-70后那帮学者摘完了,什么描写语法、功能语法、配价语法、生成语法、依存语法之类的,从理论到资源建设,就没有他们没涉及的,建国以来他们都是借鉴融合、紧跟国外的语言学理论发展方向的,站在巨人肩上,用几十年的时间把国内共时语言学研究拉到和欧美语言学界平均水平。

现在留给青年学者的都是硬骨头——怎么说说清楚语义?我们当然也还是会拿西方做镜子,但是自然语言处理技术(Natural Language Processing,NLP)经过近十来年的飞速发展,对语言学的影响主要在两方面:

一方面,检验了语法理论成果的实用性,导致形式语法逐渐式微,依存语法强势崛起与前者平起平坐,然而,技术发展真是太快了,虽然这两种句法仍然是主流,但传导错误也很严重,领域迁移鲁棒性差,学界目前虽然还较多地使用句法结构数据,但工业界大多是能不用就不用。然而,目前NLP就是纸老虎,经常像人工智障。虽然,算法大佬们大都致力于靠算法模型搞出一个好的语言学模型出来使机器搞懂语言;但是,语言学界也一定会参与进来给出自己的回答,比如生成词库论、结合韵律句法的语体语法、意合语法、篇章语法都方兴未艾,不过值得注意的是,这些语法理论在研究范围和研究方法上比传统的语法理论有更清楚的界定,基本上会尽量避免模糊下定义,尽量做到可量化,分类依据、分类结果会倾向于明确,描写也会更注重量化分析,会把趋向性与选择性以可量化的形式描写得更清楚(做不到这点,文章会越来越难发出来,老一辈的靠着自己积攒多年的影响力还能勉强发出点声音,年轻一辈不要心存侥幸,所以那些即将读研的童鞋们选导师尽量避免选择还在为“王冕死了父亲”“鸡不吃了”“爱V不V”之类问题争论不休的导师,时代变了,吃饭和前途要紧)。

另一方面,技术的发展可以极大地提升研究效率,即语言学者会有更多可观察的语料(几十上百G语料都可以找到),也会有更方便的检索方式(包括句法结构检索),也会有更直接的验证方式(能否指导资源建设、自动评阅、篇章分析等),当然这就意味着作为句法语义研究的学者需要掌握基本支撑研究的编程语言(python会是主流),或者联合相关技术研究者组团打怪升级(对双方要求都较高,需要能理解对方学科的基本思想)。

其次,二语教学汉语市场、翻译市场会受影响,表现在汉语教学市场进一步缩小,低水平翻译专业的从业人员将受到极大冲击。我没有高赞答主那么乐观,当然也没太悲观,这个等我搞完年终汇报、盘点再来补充吧。


2020/01/01 终于熬过了悲催的一年,新年把去年没完成的题答完吧。

二语教学、人工翻译与机器翻译是一体三面。

一方面,我们要承认各种翻译软件过去5年有非常大的发展,也要相信未来5年也一定会进一步发展。目前的技术,从语音识别翻译到文本识别翻译,生活日常沟通、旅行购物需求无疑是没问题了,而在一些很正式的场合,也能勉勉强强(虽然去年某狗现场翻译经常死机重启、某飞被曝剽窃同传)。再过5年我们有理由相信相关语言数据资源会更丰富,特别是汉语方面,机器翻译作为NLP中最早的也是目前商业落地最好的方向,对应的相关技术未来5年肯定也会有大的发展,这点可以参考CV方向商业落地后的发展情况。

另一方面,二语学习对大部分人来说是需要付出极大努力的事,如果现在技术可以满足基本需求,可能就没那么多学习者了,特别是非英语的语言。如果不是商业和学业交流的刚性需求,对普通大众而言,入个门就可以依靠现在便捷又能达意的各式翻译APP混了,靠翻译吃饭,需要把外语学得很精通,而这需要付出巨大的时间成本和精力,特别是学习跟自己语言相差甚大的语言,汉语对很多外语来说就是这样一种语言。当旅游、日常生活、简单文字翻译靠夹生汉语加各种实时翻译软件就可以解决问题的时候,人都是懒惰的,过了新鲜劲儿,往往就放弃了。我的一个教授,美国人,来中国三年了,上课就全英文,偶尔感觉我们听不懂一些词,拿起手机来对着一通说,手机就翻译成汉语说出来,虽然翻译的词不一定那么准确,但学生靠背景知识基本就知道专业的或更准确的汉语说法了;而在生活中呢,这个家伙就靠着自己夹生的汉语加各种手机APP翻译,走遍了中国。如果大家生活在一线城市,可以尝试做一些调查,看看这几年汉语培训学校起起落落落落落……趋势有多大;国际高中的留学生人数下滑趋势及国别分布集中趋势(韩、泰越老缅、前苏解体诸国、富非州诸国)如何;非top10以内的高校,来华留学生都是什么构成情况,是不是非洲、泰越缅老韩诸国及前苏解体诸国人比重越来越大,拿奖学金或者享受折扣学费的学生比重是不是越来越多;看看各大网站、圈内群中有多少狡猾的老鸟自己开发不出汉语学习者的培训市场,转而天天各种授课、卖资源赚刚入门的汉语从业者的钱。当然,我没有具体的数据,这个留给相关从业者去考察吧。


然而,尽管如此,这并不意味着我在唱衰二语教学与人工翻译。

就翻译来说,翻译从业人员将需要以绝对专业职业能力作为职业护城河。

语言不只是传递信息的工具(达意),还是传情交际的工具,达意机器还可差强人意(虽然不一定精准或者具有文学美感),然而传情这点机器现在是做不到的。什么意思呢,比如,交际过程中什么场景下说什么话合适(比如敬语使用、陈述与反问使用、比喻与隐喻使用)、亲昵与疏远等的边界在哪里、会话与篇章如何组织能连贯及衔接等,这些问题我们相信在未来很多年(可能是我有生之年)都解决不了;此外,语言和语言之间的词并不是一一对应的,如何表达目标语言中不存在的词或现象、如何表达光怪陆离的网络用语现象、如何快速理解不同语言之间随意切换(比如中英夹杂、普通话与方言夹杂、今文与古文夹杂)等。这些都是机器现在不能能解决的问题,而这些对人之间的交际(不只是面对面地交谈,也包括作者与读者的神遇)、如何绝对精确地对译(国际商贸合同、外交合同等)却极为重要,这些正是高级人工翻译无法被取代的原因。

与此同时,机器翻译水平的提高,可以极大地提高专业翻译人员的效率,甚至可能净化翻译市场,提高从业人员的待遇。不知道大家是否有过这样的体验,让你从零开始翻译一篇文章是很头疼的,但是谷歌翻译一下有个底稿,虽然很烂,但是在此基础上改起来却远比自己从零开始翻译容易多了;机器翻译水平的进步,人们对翻译质量要求会更苛刻,特别是像汉语这样有着丰富文化资源的语言,一方面会淘汰一些半吊子从业人员和工作室,存活下来的最终将是语言输出能力对机器保持绝对优势的队伍,高端翻译市场只会更稳固,价格也只会更高。

就教学来说,机器辅助教学及学习资源获取便捷,可极大地提高自学效率,市场对语言从业者的专业要求也更高。

语言教学大致包含“听说读写”四个方面。比如,“听说”往往是一体的,很多语言教学的老师其实是不会教听说课的,学生发音错了,他就只一味地反复重复教学生发音,这点现在的教学辅助软件也完全可以做到,而且做得比人还好,可以准确地识别你具体那个音位发得不对,并让你反复读,反复给你一个50分,反正我内心说了一万遍F-word。而一个专业的语言老师会先判断你是因为听不出这个音而无法发音正确,还是因为你听懂了但发音肌肉缺乏锻炼而无法发音正确,不同的原因有不同的训练方法,而且对容错点可以把握得很准确,此外他有记忆和分析能力,在未来很长一段时间都会有意识地在交流中训练你对错误点进行听辨、发音;再比如,很多语言都开发了训练词汇使用的对话系统,就跟很多水货教师教学生生字词时,机械地造句的对话游戏,而一个专业的教师,会去激活学生的已有背景知识,设置合适的使用场景把这个词活用到对话中、实列中,并同时能做到以旧带新引出以学过的相关、相近的内容。这些都是机器无法做到的,而也是专业教师保有市场的法宝。

比如“读”,不同水平的学生阅读什么样的文本比较合适,这个问题经验的判断往往是很主观的,而统计的方法辅助专业教师判断是解决问题的最好方法,根据统计分析词的难度分布、句长、句法难度分布(汉语的比较难)等,自动改换难词、难句,辅以专业人士校订及内容选题把关是目前分级阅读的主要做法,现在一些小作坊式的培训机构搞的所谓分级阅读,真的是一言难尽。

比如“写”,一些语言教学者给学生改写作,直接就是把他认为错的、表达不够好的地方改成正确的就了事,学生问为什么,往往说不清,这就和现在的自动改错系统没什么差别了,自动改错系统也可以逐句把你所有的语法错误、用词可能不准确的地方标识出来,还能针对同一个错误给你好几条修改意见,这就是Grammarly和微软小英吃饭的本事(顺便佩服一下批阅这个市场上的大佬们,开源让大家使用培养用户抢占市场,同时也变相在积累语料和迭代系统,数据为王的时代,真是打得一手好算盘,其它的speaky、italki也差不多),那如果写作辅导就是这么简单,真的不需要老师了。一个专业的写作老师知道篇章有衔接性、连贯性、目的性、可接受性、信息性、情景性、互文7个基本特点,每个特点下有若干策略和手段,这其中的任何一点都是机器做不到的,未来很长一段时间机器都不可能做到。

总结一下:未来5年或者更远的未来,AI行业的发展一定会对理论语言学、应用语言学带来极大的影响,这些影响对于相关从业者来说有好有坏,对行业来说则完全是好事,强迫相关人士关注技术、关注现实、学习及掌握技术工具。但以我初浅的认识来看,鼓吹语言学将被自然语言处理取代也是没有道理的,语言学研究的对象是语言,语言是活的,一旦进入交际,它编码知识、存储知识、激活我们人类共享的大量背景知识与场景,并以此为基础自发而灵活地交流;而AI技术本质是在一个较为确定系统基础上处理语言、判断、反馈、输出的,它有自己的潜力和局限。

顶一下
(0)
0%
踩一下
(0)
0%
相关评论
我要评论
用户名: 验证码:点击我更换图片