【嘉勤点评】百度发明的基于人工智能的辅助写作方案,能够基于人工智能对写作原文进行处理,从而得到写作辅助信息,并将相应的写作辅助信息展示给用户,从而提升辅助用户写作的疗效。
集微网消息,全民关注的2022年中考如约袭来。在此次中考中,百度推出的数字人度晓晓作答了全省新中考Ⅰ卷题为《本手、妙手、俗手》的议论文,曾兼任上海中考英语阅卷组主任的申怡觉得,该习作紧扣主题、立意明晰,结构完整且语言流畅。
度晓晓的“写作能力”正是构建在人工智能的基础上实现的,人工智能是研究、开发用于模拟、延伸和扩充人的智能的理论、方法、技术及应用系统的一门新的技术科学。其是计算机科学的一个分支,它试图了解智能的实质,并生产出一种新的能以人类智能相像的形式作出反应的智能机器。
现实生活中,许多人在写作的时侯常常由于自己的文笔不佳而倍感苦恼,很多时侯想不出合适的成语和语句,写下来的文章枯黄惨白,或者是因为自己的阅读储备太少,没有写作灵感。这个时侯就须要一个智能工具来帮助写作者。
为此,百度早在2016年10月28日就申请了一项名为“基于人工智能的辅助写作技巧和装置”的发明专利(申请号:201610972240.7),申请人为北京百度网讯科技有限公司。
根据该专利目前公开的相关资料,让我们一起来瞧瞧这项技术方案吧。
如上图,为该专利中发明的基于人工智能的辅助写作技巧的流程示意图,首先,获取用户输入的写作原文。接着,基于人工智能对写作原文进行处理,得到写作辅助信息,该过程中主要借助人工智能中的自然语言处理技术进行相应的处理。随后,系统再将写作辅助信息展示给用户。
如上图,为该专利中示意的词句替换推荐功能和成语联想功能的展示界面示意图,上图中的上方文本是用户输入的写作原文21,在用户输入写作原文后,给出如下方的右边所示的词句替换部份22,该方案中的装置会手动辨识写作原文中可被替换的词句(并且可以用预设标记进行标示),再基于人工智能给出可被替换的词句的推荐成语。
每个可被替换的词句的推荐成语可以在键盘光标漂浮在可被替换的词句上时展示相应的推荐成语。在将推荐成语展示给用户时,用户可以点击须要的推荐成语后,用点击的推荐成语替换相应的可被替换的熟语。这样用户就不会由于找不到确切的用词而苦恼了。
在进行具体的实现过程中,会首先对原文进行切词,以得到组成写作原文的动词。对应各个动词,基于人工智能辨识相应的动词是否为可被替换的成语,并在动词为可被替换的词句时,确定动词的词句替换推荐信息。
其中,会按照每位替换词对应的语言模型得分、文采得分、用户的点选信息,得到每位替换词的综合得分。如果存在综合得分小于预设得分的替换词,则确定该动词是可被替换的成语,并将综合得分小于预设得分的替换词根据综合得分进行排序,在排序后的替换词中按序选择预设个数的替换词作为该动词的词句替换推荐信息。
此外,该系统还具有词汇联想、灵感迸发、智能素材推荐、智能基础改写以及智能润色改写功能。
如上图,为该系统进行智能素材推荐功能的展示界面示意图,对应写作原文,系统给出了智能素材推荐部份。在该过程中,系统会深度剖析和理解用户提供的写作原文,为用户推荐相关主题的写作素材(如新闻、历史故事等),用户也可以自己选择想要的素材类型,比如新闻、历史故事等,此功能在议论文写作中十分实用。
在该功能的实现过程中,首先会从公开的网页数据中抓取优质的新闻、人文历史故事等候选素材,然后用摘要技术和文档标签技术分别对抓取的语料进行处理,生成相应摘要和文档标签。通过抽取出用户输入文本中的主题词,然后与语料的标签进行比对,召回一批候选的相仿主题的素材。再使用主题模型估算用户输入与摘要的相似度,对候选的素材进行排序,将相像较高的呈现的素材的摘要呈现给用户。
最后,如上图,为该系统进行智能润色改写功能的展示界面示意图,该功能主要可以分解为三个部份:词语的替换,句子的改写以及降低成语或短语。词语的替换承袭成语替换推荐功能的技术方案,使用最优的替换结果。
句子的改写有两种方案,方案一是人工配置一些润色的规则,方案二是人工标明一些润色的训练语料,用RNN或则LSTM神经网路来进行学习。增加词或短语功能可以通过一定的模板挖掘从大数据语料中挖掘出实体或则主题对应的描写词和描写句子,并同时记录下句子周围的关键词。每次对输入文本的诗句作解析,用CRF模型或则复句剖析规则找出语句的核心主体词,然后按照周围关键词的匹配,添加合适的描写词或描写句子。
以上就是百度发明的基于人工智能的辅助写作方案,该方案才能基于人工智能对写作原文进行处理,从而得到写作辅助信息,并将相应的写作辅助信息展示给用户,从而提升辅助用户写作的疗效。