利用爬虫技术建立机器翻译的语料库。具体思路可以参考知乎大V刘 飞的文章:网上双语的资源还是挺多的,利用爬虫技术在爬取网页时 对当前网页进行简易判断,如果有双语嫌疑,则收录整理出来双语的 正文;如果没有,弃用; 将正文内容进行详细判断 ...