“如果想伺机而动,就是这样。”——杰克船长提到海盗,我们往往联想到约翰尼·德普在《加勒比海盗》中饰演的杰克船长。我们有什么理由不喜欢海盗呢?他们航行在海上,寻找埋藏的宝藏,痛饮朗姆酒,用自己独特的海盗语言交谈。
除了神气活现、似乎总有喝不完的朗姆酒,还有机会像下一季的伯金那样佩戴钩子,做海盗(或假扮成海盗)的妙处就是海盗那独特而又非常微妙的语言。当然,我们都知道“ahoy(喂,海盗之间打招呼的典型用语)”和“parley(《海盗法典》规定的海盗谈判,即:对方要求谈判,在谈判结束前,海盗不能伤害对方)”这两个词,但实际上,海盗语言并不仅仅是几个关键短语,而这正是AI和高质量、无偏见的训练数据有所作为之处。多亏有了AI,我们可以创造新的语言(构造语言),让古老的语言复活,或者扩展我们知道和喜爱的现有语言,如克林贡语或精灵语。AI更常见、更直接的用例是帮助我们学习新语言。
AI提供支持的语言学习
使用语言学习应用程序和网站,在出国旅行前,您可以学几个单词以备不时之需,还可以利用有限的预算学习一门新语言,而不必上课或是请家教。
Duolingo(多邻国)是一款最常用的语言学习程序,他们利用AI为所有用户创建最合适的语言学习课程。用户学完一课时,他们在学习中做对和做错的题目都会被保存下来,这些数据还被发回应用程序进行分析。具体而言,Duolingo公司希望据此了解用户在学习各节课时最常犯的错误是什么。这正是AI大显身手之处,该公司的Birdbrain程序会根据每个用户的优势和劣势为其打造个性化体验,创建相应课程计划,确保最大限度地发挥其学习潜能。
早在2013年,Duolingo就开始使用AI帮助计算用户过多长时间会忘记已经学过的词汇。该公司2019年推出新的AI程序Birdbrain。它的算法一开始并不知道一切。最初,该程序只知道用户是对还是错,随着时间的推移,它必须明白为什么错误被判定为是错的。找出错误原因的程序名为Blame。
虽然Duolingo不提供海盗语言课程,但的确有克林贡语和高等瓦雷利亚语课程,而如果您向往海盗生活,Daily Press曾推出过海盗词汇手册。
AI保护历史文化:一次保护一种语言
可用文本和音频数据语言样本的数据库。他发起这个项目的一个原因是,最后一个流利使用这种语言的人在20多年前就去世了,创建数据库将能确保后代能够学习这种语言,让它不致绝迹。他选择与澳鹏合作,是因为他知道我们能够应对这个项目的挑战,提供无偏见的、多样化的训练数据。
这个项目的一个最大挑战是有两个数据库,一个是音频数据库,一个是文本数据库,二者没有连接在一起。我们于此入手,帮助将两个数据库关联起来。如需了解我们的具体做法,请点击此处,阅读我们的案例研究。
AI能创造您不知道自己需要的语言
如果您想知道AI程序是否会相互交流以及使用哪种语言,恐怕您会想当然脱口而出。有两个例子,在这两个例子中AI程序能创建自己的语言来相互交流,虽然我们可能以为是胡言乱语,但对AI却是真正的语言。
一个例子是训练Facebook聊天机器人谈判。(训练中)他们不得不调整其中一个模型,因为如果不这样做,由于聊天机器人开发了自己的谈判语言,它们之间的对话就“会导致与人类语言的分歧。”
另一个例子是DALL-E2,它是OpenAI开发的一个AI系统。DALL-E2要完成的任务很简单,即根据所提供的描述生成图像。最近,AI模型在生成图像时所提供的内容一开始被认为是胡言乱语,让人一头雾水。然而,在有人将这些胡言乱语输入系统后,系统就会生成之前要求生成的同样图像。受此启发,还诞生了一篇关于DALL-E2的隐藏词汇的论文。
这就引出一个问题:如果我们让AI创造自己的语言,会是什么情况?我们会得到类似海盗语言那样的航海语言、还是像精灵语那样更神奇的语言?
构造语言更有趣
Conlang(或构造语言)是一个用来描述由个人所创造的语言的术语(如美剧《权力的游戏》中的高等瓦雷利亚语),与本文所使用的语言不同,这种语言不是在社会中自然产生的。构造语言不仅仅是为了说话,它还包括其他构造语言,如编程语言,而自然语言处理(NLP)只是让计算机能够像人类一样理解现有的自然语言。
为庆祝“国际海盗语言日”,为什么不自创一种新语言呢?
国际海盗语言日
1995年,美国人马克·桑莫斯和约翰·鲍尔在打壁球时共同创立了这个新节日。后来,约翰和马克写信给幽默专栏作家戴夫·巴里,这个节日才被世人所知。巴里让这个节日得以曝光,成为一个世界性的节日。