文言文白话文互转:文言文转白话文(现代文),白话文(现代文)转文言文
这篇讲的是作者利用一个开源的文言文-现代文平行语料库,动手实践了双向互译模型的全过程。起点是东北大学团队整理的约96万句对经典古籍对齐数据,这份珍贵语料覆盖广且经过人工校对,为模型训练打下了基础。作者基于此,训练了文言文转白话文、白话文转文言文两个独立的神经网络机器翻译模型,并将它们集成到AINLP公众号,用户可通过指令直接测试。文中展示了几个转换示例,说明了模型已能完成基本互译,不过作者也坦诚效果基于现有数据和模型,“仅供一乐”。整体来看,这是一次从优质语料获取、模型训练到功能部署的完整技术实践,让古籍翻译的探索变得具体而可玩。