“我们在专利翻译的质量上要优于 Google
翻译,我们与大学网络合作成立了一个小型团队,而我们已经能够击败一个资金充足的公司了。”

微型技术团队的细分领域探索

目前,Wipo
已经推出了公测版,供普通民众试用。从测试版提供的译文编辑功能来看,应该是会将用户所修改的版本作为机器学习的来源之一。

对于像WIPO这样的非技术性组织来说,如何进一步运用自身积累的大量数据资源?如何使用新技术减少巨大、枯燥并且重复性人工劳动的工作量?有没有可能通过技术手段,帮助工作人员提高专利、商标等知识产权方面的审查工作?澳门新葡亰,在这一波人工智能的热潮来临之前,WIPO早在2010年就已经开始进行人工智能技术在专利领域方面的应用探索。

世界知识产权组织(WIPO)总干事弗朗西斯·居里(Francis Gurry)表示,AI
是一个需要重金投资和投入大量专家的的行业,而新的 Wipo
系统表明公共组织也能够在实际应用中与财大气粗的科技公司竞争。

WIPO仅使用开放源代码库,因为在这样的尖端领域,通常最先进的是开源的。
此外,开源可以根据自己的需要客户化定制/调整软件,然后与其他公益组织共享软件。

via:爱范儿

WIPO在知识产权领域开发和应用人工智能方面一直处于领先地位。2010年,WIPO全球数据库部门的Christophe
MAZENC招聘到了人工智能应用开发的第一位员工。两人开始了WIPO机器翻译工具的开发工作,两年以后,WIPO有了第一个版本的机器翻译工具。到今天,这个团队发展成为先进技术应用中心,第一位AI开发者Bruno
Pouliquen也已经成为部门负责人,管理着5人的团队。

居里表示,这套系统将免费提供给大学和其他非营利组织使用,而商业机构则需要支付一定的费用,“我们希望能够赚取足够的资金来支付我们的投资成本。”

任何的机器学习技术,都需要经过合适的训练数据集的“训练”才能产生作用。因此,ATAC需要找到足够的训练数据,才能在此基础上开发。这个小型开发团队决定在拥有高质量数据、最新数据的领域做开发。

研究人员一开始训练 Wipo
时,让它从中文、日语和韩语入手,将这些语言的文档翻译成英语,因为以这三门语言撰写的专利申请占全世界专利申请量的一半以上,其中以中国的增长最为迅速。

对其他组织转型的建议

澳门新葡亰 1

虽然是内部开发,但Bruno的团队还会借助“外脑”使自己能够掌握最新技术。ATAC与学术界有很多合作,与学术界建立了良好的沟通网络,以此了解和掌握相关领域最前沿的技术。通过阅读科学期刊上的最新论文、参加国际学术界会议等方式来保持对自信技术的追踪。因为通常学术界的技术开发都是开源的。ATAC通过对学术界最新研究的跟踪与学习来保持技术的领先性。

Wipo 项目的成员主要来自爱丁堡和蒙利利尔这两所大学的工程师与 AI
学术专家,他们研发的“神经网络”能够在精确翻译专利技术语言的同时,保留比其它系统更为自然的语序,这一点在翻译两门差别较大的语言时,优势尤其明显。

ATAC是如何为算法找到大量训练数据集的?与谷歌翻译所不同的是,WIPO没有海量的互联网数据做“燃料”。但Bruno认为,一个高质量数据训练集比一个更大的数据训练集更好。而且,使用最新的数据比更多的数据更重要。在专利领域,使用最新的术语能够训练出更好的模型。ATAC使用高质量数据的办法是这样的,他们找出曾经在美国和中国都申请过的中文专利,从中国专利局和美国专利局获得同一个专利文件,用这些经过官方认证的翻译文件来训练机器学习算法。在中英翻译方面,ATAC将中国国家知识产权局提供的共计
6000
万句中文,与由专业人员翻译并提交给美国专利局的英文版进行对比“学习”。

Wipo
采用了专门为神经网络设计的新一代图形处理单元(GPU),将中国国家知识产权局提供的文件共计 6000
万句中文,与其提交给美国专利局的英文版(由专业人员翻译)进行对比,逐步进行“学习”。

WIPO是联合国领导的发展国际知识产权制度的专门机构,是由191个成员国组成的关于知识产权服务、政策、合作与信息的全球论坛。WIPO的专利合作条约(PCT)是一个国际专利体系,方便申请人在国际上寻求对其发明的国际专利保护,帮助专利局出专利授权决定。通过PCT提交国际专利申请,申请人可以同时在全世界大多数国家寻求对其发明的保护。WIPO的特性决定了其在专利领域拥有海量的专业数据。随着全球知识产权申请数量不断增加,相关数据的数量增长使得不使用AI工具采集和分析数据变得几乎不可能。截至2017年2月,PCT已经授权了300万件国际专利。由于在WIPO的专利申请数据库中,大约只有三分之一的文件为英文,因此在国际专利保护领域,涉及到大量专利申请文件的翻译工作。

与普通翻译不同,专利翻译由于涉及众多专业词汇,翻译机构通常会借助专门的工具进行处理。如今,联合国已经开发出了一种基于人工智能的翻译机
Wipo,将专利翻译的质量又提升了一个档次。

目前,除了机器翻译应用,WIPO与学术界进一步的技术合作进行专利自动分类的应用开发。在WIPO工作人员接触的专利里,有一些是没有根据国际专利分类来分类的,如果采用机器学习的方法自动通过文档本身的内容来判断出专利应该被分到哪个类别里将极大的提高分类效率。除了WIPO,在世界各地的知识产权局,也在商标图形检索、商标审查、专利现有技术检索与分析、服务聊天机器人等人工智能领域有许多AI技术的尝试性应用。

网站地图xml地图