国产在线高清中文字幕_一区精品麻豆入口_99精品国产一区二区三区不卡_尤物久久99国产综合精品高清版_欧美中文字幕在线看_欧美猛交喷潮在线播放_国产小嫩模无套视频在线观看_精品无人区无码乱码大片国产_亚洲日本韩国中国18禁_亚洲AV无一区二区三区久久,少妇人妻综合久久中文字幕,性XXXX视频播放免费,国产又色又爽又刺激在线播放_国产又黄又硬又粗无遮挡视频_亚洲蜜桃无码一区二区三区_日本精品一区二区三区高清_欧美精品综合视频一区二区_中文日韩欧美天堂神马久久

注冊  |  登錄

閱讀率與人工稿件基本持平 機器寫作正逐漸被接受

2019-12-10 13:55:06    來源:科技日報    

近幾年,,機器寫作不再是紙上談兵的技術(shù),已然滲透到了我們的生活之中,。今日頭條,、騰訊、百度,、360等公司,,以及新華社、南方都市報,、第一財經(jīng)等傳統(tǒng)媒體單位均開展了機器寫作技術(shù)的研究與應(yīng)用,。

不久前,在北京大學(xué)科技成果發(fā)布會暨北京市科技成果轉(zhuǎn)化統(tǒng)籌協(xié)調(diào)與服務(wù)平臺系列項目路演中,,北京大學(xué)計算機科學(xué)技術(shù)研究所研究員萬小軍的AI寫作機器人頗受關(guān)注,。

據(jù)介紹,,這項成果已應(yīng)用于多家媒體單位,,研發(fā)單位與各媒體單位合作推出了小明、小南,、小柯等多款寫作機器人,,各類機器人已經(jīng)自動撰寫新聞稿件十萬多篇。

除了新聞寫作,,還能應(yīng)用于這些領(lǐng)域

機器寫作,,又稱自然語言生成,是自然語言處理領(lǐng)域的重要研究方向和研究熱點之一,, 也是人工智能走向成熟的重要標(biāo)志之一,。

目前,機器寫作在傳媒,、出版,、文娛、廣告等多個行業(yè)均具有廣闊應(yīng)用場景,。歐美等地較早成立專注于機器寫作技術(shù)應(yīng)用的多家公司,,例如ARRIA、AI,、NarrativeScience等基于行業(yè)數(shù)據(jù),,通過機器寫作生成行業(yè)報告或新聞報道,,從而節(jié)省大量人力。同時,,不少國外知名媒體單位紛紛采用機器寫作技術(shù)進行新聞稿件創(chuàng)作,,以節(jié)約人力成本,提高效率,。

“與人類作者相比,,機器寫作具有效率高、時效性好,、覆蓋性強,、無偏見等優(yōu)勢。今日頭條的線上測試表明,,機器人撰寫新聞稿件的閱讀率與人工稿件的閱讀率基本相同,,這說明機器稿件的質(zhì)量不錯,能夠被廣大用戶所接受,?!比f小軍告訴記者。

萬小軍說,,我們希望計算機同時具有讀與寫的能力,,除了掌握閱讀和理解語言文字的本領(lǐng)之外,還能夠掌握文字創(chuàng)作的本領(lǐng),,從而像人類一樣寫出高質(zhì)量的文字作品,,例如新聞資訊、報告,、詩歌,、小說、作文等,。

然而,,計算機不能憑空寫作,必須根據(jù)所輸入的數(shù)據(jù)與素材進行創(chuàng)作,。據(jù)介紹,,根據(jù)輸入的不同類型的信息,計算機一般采用不同的寫作方式進行創(chuàng)作,。例如,,計算機根據(jù)輸入的結(jié)構(gòu)化數(shù)據(jù)(報表、RDF數(shù)據(jù)等)進行文字創(chuàng)作,,從而能夠生成稿件,。這是目前機器寫作應(yīng)用的主要方式,適用于天氣預(yù)報、醫(yī)療報告,、賽事簡訊,、財經(jīng)報道等文本的生成。

萬小軍介紹說,,近幾年機器寫作除了用于撰寫新聞,、報告等實用型文本之外,還被用于創(chuàng)作古詩,、現(xiàn)代詩,、散文等文學(xué)作品,例如微軟小冰,、清華九歌等系統(tǒng)分別能夠創(chuàng)作現(xiàn)代詩和古詩,,在文字表現(xiàn)形式上的總體效果還不錯,但在意境上有所欠缺,。

深度學(xué)習(xí)生成模型,,但還難保準(zhǔn)確性和可讀性

近幾年,深度學(xué)習(xí)發(fā)展迅速,,機器寫作技術(shù)也受到其深刻影響,。

據(jù)萬小軍介紹,基于深度學(xué)習(xí)技術(shù)進行文本生成,,不依賴于模板或規(guī)則,。然而,這樣的寫作方式雖然在研究上取得一定進展,,但目前還不能保證所生成稿件的準(zhǔn)確性與可讀性,,難以滿足很多應(yīng)用場景下對稿件的質(zhì)量要求。此外,,深度學(xué)習(xí)生成的模型訓(xùn)練需要大量的平行語料,,而在很多領(lǐng)域內(nèi)較難獲取到這樣的大規(guī)模語料。

計算機根據(jù)已有的文字素材(例如已經(jīng)發(fā)表的新聞)進行二次文字創(chuàng)作時,,能夠基于已有稿件創(chuàng)作出不一樣的稿件,主要依賴于兩類自然語言處理技術(shù):自動文摘與文本復(fù)述,。其中自動文摘用于對單篇文本或多篇文本進行內(nèi)容提煉與綜合,,形成摘要或綜述。

萬小軍指出,,多文檔自動文摘比單文檔自動文摘更具有挑戰(zhàn)性,,原因在于不同文檔內(nèi)容的冗余性、片面性與弱連貫性,。因此,,對多篇新聞報道進行長篇綜述生成極其困難,其研究團隊在這方面進行了嘗試,提出基于段落排序與融合的方法為多篇新聞報道進行綜述生成,,取得一定效果,。

文本復(fù)述則用于對現(xiàn)有文字進行改寫,在主題與意思基本不變的前提下產(chǎn)生另一種文字表述,,從而避免原文照抄,,也可實現(xiàn)文本風(fēng)格化的目的。文本復(fù)述可以看作是一種單語言機器翻譯問題,,因此在平行語料充足的前提下,,各種統(tǒng)計機器翻譯方法(包括神經(jīng)網(wǎng)絡(luò)機器翻譯)均可應(yīng)用于此問題。但現(xiàn)實中卻難以獲得大規(guī)模的此類平行語料,,因此針對文本復(fù)述的研究需要另辟蹊徑,,最新的研究主要集中在如何有效利用少量的平行語料和大規(guī)模的非平行語料進行復(fù)述模型的學(xué)習(xí)。

[責(zé)任編輯:張亞茹]
內(nèi)容頁廣告2
3
內(nèi)容4
內(nèi)容5

關(guān)于我們| 網(wǎng)站概況| 法律顧問| 服務(wù)條款| 人員查詢| 廣告服務(wù)| 供稿服務(wù)| 合作伙伴| 網(wǎng)站聲明| 版權(quán)所有| 聯(lián)系我們

郵箱:[email protected]    電話:18511349188

備案號:京ICP備16016777號-6

Copyright? 2016 WeiJiLu.All Rights Reserved