Lingua Libre
网站类型 |
|
---|---|
语言 | 多语言 |
持有者 | 法国维基媒体协会 |
创始人 | 法国维基媒体协会与维基媒体社群 |
网址 | lingualibre |
广告 | 无 |
商业性质 | 否 |
注册 | 选择性,但若要录制则为必要 |
推出时间 | 2016年8月 |
现状 | 活跃 |
内容许可 | 创用CC姓名标示-相同方式分享 4.0 国际 (CC BY-SA 4.0) |
Lingua Libre是法国维基媒体协会建立的一个线上协作专案与工具,用以建立使用使用自由授权条款的协作、多语言、视听语料库。
描述
Lingua Libre可以录制任何语言的单字、短语或句子,包含口语(录音)或手语(录影)。
单字以列表的形式呈现给要录制语音的人,该列表可能会是即时制作或是提前制作,又或是使用既有的维基媒体分类。录制语音的人只需要念出萤幕上显示的单字,当软体侦测到念完单字后的沉默时,就会跳到下一个单字。[1]这个行为是在其建立者,Nicolas Vion,的协助下从开放原始码软体Shtooka录制程式处借用,使得每小时录制数百个单字成为可能。然后录音会自动从网页客户端上传至维基共享资源媒体库。
2021年春季,Lingua Libre因史特拉斯堡发生火灾而离线,[2]但并未遗失任何录音。[3]
使用录音
可在Lingua Libre或维基共享资源上查阅录音。其主要用于其他维基媒体专案,例如用来说明维基词典中的条目或是维基百科文章中的专有名词。[1]
并可在语言教学环境中重复使用录音,语言学习者可以免费下载发音并在流行的词典软体GoldenDict上使用。[4]因此,此处的录音可在GoldenDict上作为“发音词典”使用,而不需要网际网路连线。
这些录音也会在自然语言处理专案中重复使用,例如用来驱动Mozilla的DeepSpeech语音识别引擎。[5]
版本
Lingua Libre于2015年1月23日启动[6],经历过三个主要版本:
Lingua Libre v.1 (2016)
作为Languages of France专案的一部分,该专案目标是在维基媒体与网际网路专案上记录并推广法国的区域语言,Lingua Libre的概念于2015年11月开始,部份资金来自DGLFLF(法语及法国语言总代表团,英语:General Delegation for the French language and the languages of France)。该专案的第一个版本于2016年8月推出。当时仅适用于录音,Lingua Libre在2016年12月的奥克语工作坊上展示,[7][8]然后呈现给线上维基媒体社群[9],也于2017年的国际活动上展示。
Lingua Libre v.2 (2018)
2017年底全面重建。新版Lingua Libre是以MediaWiki为基础,使用Wikibase与OAuth以便更好地融入维基媒体环境。其介面透过Translatewiki.net翻译,因此该专案可被大量社群使用。新版的网站于2018年6月准备就绪[10],并于2018年8月向大众开放。
Lingua Libre v.2.2 (2020)
2020年,平台发生重大变化;有了专为该网站开发的新外观,而.org网域也取代了先前使用的.fr网域。[11]Lingua Libre现在支援透过视讯录制手语。
-
2017年9月 (v.1) 时的录音室画面
-
2018年12月 (v.2) 时的录音室画面
-
2020年10月 (v.2.2) 时的录音室画面
统计资料
在专案启动的前两年,大约制作了一万份的录音。向v.2的过渡也同时伴随著贡献的快速增加。在不到一年的时间内,录音的数量增加超过十倍,于2019年5月时就超过十万份,这些录音是由127位贡献者以近50种语言录制的。[12]到了2020年9月,该平台已有90种语言的超过三十万份录音,贡献者超过350人。2021年6月达到了五十万份录音的里程碑这要归功于120种语言的540名贡献者。[13]
参见
参考资料
- ^ 1.0 1.1 Sabine Buchwald. Wie Wikipedia Bairisch lernt. Süddeutsche Zeitung. 2019-08-04 [2022-08-21]. (原始内容存档于2023-01-18) (德语).
- ^ France : un incendie se déclare au datacenter OVHcloud de Strasbourg. Wikinews French. 2021-03-11 [2022-08-21]. (原始内容存档于2022-08-08) (法语).
- ^ Lingua Libre 2.3 - Phoenix Edition ǃ. Meta-wiki. 2021-03-19 [2022-08-21]. (原始内容存档于2021-05-07).
- ^ GoldenDict: Dictionary with Wikipedia integration - gHacks Tech News. 2017-07-10 [2022-08-21]. (原始内容存档于2022-06-26).
- ^ Modèle français 0.4 pour DeepSpeech v0.6. Mozilla Discourse. 2020-03-10 [2022-08-21]. (原始内容存档于2022-08-21).
- ^ Rémy Gerbet, Lingua Libre : un nouvel outil collaboratif pour le public et les chercheurs, Culture et Recherche, 2018-05-14, (137): 52 [2022-08-21], ISSN 1950-6295, (原始内容存档于2022-08-20) (法语)
- ^ French Ministry of Culture. Oc-a-thon 2016 : deux journées contributives sur l'occitan les 9 et 10 décembre. 2016-11-16 [2022-08-21]. (原始内容存档于2020-08-03) (法语).
- ^ Mathieu Denel. L'oc-a-thon, un edit-a-thon pour enrichir les projets Wikimedia et Lingua Libre en langue occitane. Wikimédia France Web Blog. 2016-12-21 [2020-12-03]. (原始内容存档于2023-01-16) (法语).
- ^ French-speaking Wiktionarists. Lingua Libre. Actualités du Wiktionnaire. 2017-08-01 [2020-12-02]. (原始内容存档于2022-07-05) (法语).
- ^ French-speaking Wiktionarists. Lingua Libre. Actualités du Wiktionnaire. 2018-07-01 [2020-12-02]. (原始内容存档于2022-08-21) (法语).
- ^ Sara Krichen. Lingua Libre fait peau neuve !. Wikimédia France Web Blog. 2020-06-02 [2020-12-02]. (原始内容存档于2022-11-29) (法语).
- ^ Miguel Trancozo Trevino. The many languages missing from the internet. BBC.com. 2020-04-15 [2022-08-21]. (原始内容存档于2023-01-18).
- ^ Lingua Libre's statistics page
外部链接
- 官方网站
- "Lingua Libre", émission spéciale Francophonie. RFI.fr. 2017-03-22 [2020-12-02]. (原始内容存档于2021-12-16) (法语).