从2015年开始,达观数据一直专注于开发自然语言处理(NLP)、光学字符识别(OCR)、知识图谱等AI技术,提供文档审阅、智能推荐、资料搜索、知识图谱等多款文本自动化解决方案。2019年正式推出“达观智能RPA”,融合语义理解模块,打造了首款国产自研“NLP+OCR+RPA” 三位一体的智能化机器人。与同业相比,达观RPA产品是市场上唯一不采用微软底层开发框架,完全独立自主研发的机器人。“比起借用国外现成框架,虽然研发的过程代价更高更困难,但是回头来看是非常值得的,因为掌握了从底层向上的所有核心技术,软件的跨平台适应能力更强,能在国内外各种操作系统上运行。”达观数据CEO陈运文表示。
围绕文本处理场景下的“数据+AI能力”,达观数据目前构建了较为完整的文本数据采集、标注、训练体系。在数据知识层构建知识仓库和知识图谱;在数据应用层训练机器学习模型并结合业务场景来开发出一系列智能机器人产品。
“所谓智能,就是从数据中提炼出信息,再从信息里进一步提炼出知识,最终利用知识去模仿人类工作的过程”,达观CEO陈运文说:“人工智能很难一蹴而就,还是要扎扎实实从数据出发,不断提炼加工,耐心训练神经网络系统,才能一点一点的突破现有的技术瓶颈。”
目前达观的系统已能顺畅处理中英文等语种的文档资料。和英文相比,中文的语法更复杂灵活,这给中文文档处理在产品实现路径和方法上带来了更大的难度与挑战。凭借扎实的自然语言理解NLP技术,达观数据推出了多款文本自动处理产品,并在业界取得了很多好评。2019年达观基于核心NLP技术研发的文档智能审阅系统,入选首批上海市人工智能创新产品和中国人工智能产业发展联盟首批智能年度优秀案例,还获得了中国人工智能学会颁发的“吴文俊人工智能科技进步奖”。
谈及近年来大热的AI和RPA等概念,达观数据陈运文表示:“叫什么概念并不重要,关键还是要为技术找对应用场景,真正让技术落地,创造价值”。文本智能化应用可分为自动阅读和自动写作两大版块,自动阅读的应用场景包括让机器人帮助人类去核对文档内容、辅助提供审批意见、查验材料有效性、分析语句意图、智能派发工单、搜索推荐资料、归纳分析原因、回答疑问等。自动写作的应用场景则让机器人像人类助手一样完成如起草报告、润色纠错、自动填表、摘要撰写、样式排版等工作。
“文本智能处理是一条困难但正确的道路,我们还面临很多技术难题要攻克,产品还有很多不足要完善”,达观CEO陈运文说:“板凳要坐十年冷,文章不写半句空,低调务实是我们团队一直坚持的做事风格,沉下心来认认真真把产品做好,把技术打扎实,才能厚积薄发,感谢投资人和朋友们对此给予的信任和支持!”