首页 > > 77

網絡作品“偽原創”花樣多 工具可自動生成文章

2017-05-10
来源:法制時報

  內容生產無疑是當前互聯網經濟的一大“風口”。不管是傳統媒體的轉型者,還是自媒體人,都將內容生產視作互聯網經濟的一個富礦,文字、視頻、音頻等產品不斷出現在各種網絡平台。

  既然是內容生產,就涉及到內容的版權問題,衍生出了網絡作品盜版侵權現象。不過,與傳統的盜版侵權相比,網絡原創作品還面臨一種新的侵權形式——“偽原創”,即通過各種手段將原作者的原創作品變成侵權者的“原創”。

  “偽原創”手段花樣百出

  劉思含目前在北京一家視頻新媒體公司市場部工作,主要業務是負責公司生產內容的版權保護。

  “我們是做科普、知識類視頻的新媒體公司,在微信、微博等很多平台上投放醫學、汽車等多個領域的內容。我們制作的每一個原創內容由三個部分組成,視頻和詳細的畫外音講解,還有相對精簡的文字。”劉思含說。

  一個原創內容包含視頻、音頻、文字三部分,按理說是不容易被他人直接“拿走”的,但劉思含恰恰遇到了這種情況。

  2016年12月27日,劉思含所在的公司上傳了一篇關於汽車外觀的原創內容。“今年2月中旬,某微信公眾號發出一篇文章,用了我們原創視頻的截圖,複制粘貼了文字版,把畫外音整理成文字。在這個基礎上,剽竊者給文章加了個開頭和從網上扒來的圖片。就這樣,對方把我們的原創要聞容變成了他的原創作品。”劉思含說。

  劉思含在微信後台與對方交涉,對方不承認。之後,劉思含所在的公司向平台投訴,並要求對方把稿子刪掉,對方回複,“既然你們都投訴了,那就交給平台方處理吧”。

  “被抄襲的不僅是我們的汽車公眾號,我們制作的其他領域的視頻,每周會發現並舉報幾次剽竊行為。”劉思含說。

  記者調查發現,目前網上的“偽原創”抄襲方法還有不少。例如“洗稿”,就是把類似的幾篇文章拼在一起,之後申請“原創”。

  目前,常見的平台審查機制主要由機器完成,即按文字內容的比例來判斷是否存在抄襲。不過,機器審查存在一個弱點,就是很難識別視頻和漫畫。

  “我們公司以創作漫畫或視頻為主,抄襲者直接對視頻進行截屏,將原創文章中的文字內容轉換成圖片,不使用文字,機器就很難識別出抄襲。”劉思含說,“我們與粉絲的互動是問答式的。在讀者留言中會有一些提問,我們在互動中作出相應解答。我了解到,有的公號甚至抄襲我們和讀者互動的內容,將這些問答內容搬到自己的文章中。”

  在線自動生成“偽原創”

  記者在調查中發現,除了劉思含提到的各種“偽原創”手法,還有一種模式——在線自動生成“偽原創”。

  記者通過閱讀多個“偽原創”工具的說明並試用,梳理出其制作過程和原理。“偽原創”的目標是通過同義詞替換的方式,讓搜索引擎認為是一篇原創文章,從而提高在搜索結果中的排名。“偽原創”工具或在線生成網站都有自己的同義詞庫,有的通過免費模式向用戶開放一部分,另一部分更大的同義詞庫則要用戶付費後才可以使用。

  “用‘偽原創’工具可以把在互聯網上複制的文章瞬間變成您自己的原創文章。”一個“偽原創”網站的說明這樣寫到。此類“偽原創”工具還可以在文章中隨意植入想被讀者看到的關鍵詞或網址,以達到宣傳作用。

  記者把原創文章複制粘貼到這樣的網站上,一鍵即可生成同義詞替換過的文章,被替換的詞通常用不同的字體和顏色標記出來。

  在這個過程中,記者發現,專業類文章替換較少;生活類的文章替換掉的詞較多;文章越長,替換率越高。在線“偽原創”工具還附帶相似度檢測、關鍵詞排序、關鍵詞統計、關鍵詞組合工具等在線工具,文章整體替換的比例在10%左右。替換後的文章可讀性降低,網站建議對文章進行人工修改提升可讀性。一個“偽原創”網站在說明中稱,“‘偽原創’文章最好將文章開頭和結尾用自己的語言組織,這樣的效果更好一些”。

  記者使用相似度檢測對原創和“偽原創”進行對比發現,機器識別出相似度在85%至98%之間。

  記者在網站上看到一個生成記錄,內容文本字符長度為734個字的文章,共替換了44個詞長度為90個字符,替換比率為12.26%。原文和替換之後的文章相似度為92.6%,如此高的相似度怎么辦?這些網站給出了進一步的“解決方案”。

  “在線生成文章,將其粘貼入前兩步已做好的‘偽原創’文章後一段即可”。記者點擊“在線生成文章”發現,生成的並不是可讀的文章,而是一段看似是中文的亂碼。將這段亂碼貼在文章最後,相似度降低到84.3%。

  除了用亂碼降低相似度,這些網站介紹稱還可以在文章中插入圖片,建議用戶打亂文章順序等方法。

  此外,記者發現,網上還可以搜索到大量關於“如何制作‘偽原創’”的教程。

  原創維權依然麻煩

  作者的原創內容遭“偽原創”剽竊,將會有哪些損失?

  “就商業價值而言,一篇文章招廣告,賣價要看這個公眾號的粉絲量有多少。大一點兒的公眾號,一篇頭條文章去年的價格大約是5萬元;剽竊我們的公號,估計一篇頭條文章的賣價在幾千元到兩三萬元之間。保守估計也可以賣出幾千元。”劉思含說。

  劉思含告訴記者,從後台數據來看,如果是關於熱點問題的原創,剽竊的作品可能在至少一個星期時間內對原創產生影響。對於科普內容而言,大部分都是沒有時效性的,剽竊對於原創的影響時間持續更久。

  面對“偽原創”侵權,原創者是否想過維權?又該如何維權?

  “對原創作者來說,他們需要投入大量精力去制作優質內容,讓他們去做維權的事情非常消耗精力。特別對於個人原創者而言,或許這一天或者一個星期特別有靈感,能寫一篇特別好的文章,結果被抄襲的事情一鬧,可能這一段時間他什么也做不了了。”劉思含說。

  據劉思含介紹,對於公司而言,遭遇剽竊後的主要訴求就是讓對方把文章刪除。“我們會時不時在後台搜一搜關鍵字,看是否有未經授權的轉載。沒有經過授權的,就算是有些人標注了來自我們的公號,我們還是會聯系對方把文章刪掉。大部分抄襲的人都挺心虛,都會刪稿。遇到不刪除的,效率比較高的做法就是向平台方舉報”。

  記者調查了解到,不同的平台對原創舉報的處理周期不同。有的平台,原創作者當天投訴,過幾個小時就會出處理結果,有些平台審核過程會比較麻煩。“尤其是公司機構,需要出示一個企業聲明,載明哪篇文章被抄襲,要加蓋公章,掃描,上傳。整個過程耗時短則兩三天,也可能更長。”劉思含說,“走法律途徑保護原創獲得賠償的方式,對公司機構而言太耗精力,不劃算。”

  劉思含所在的公司鋪設了“全網”運營渠道,不管在什么平台上發現抄襲,都可以與平台方聯系,將抄襲的文章刪掉。“但是,對於個人原創者,這個工程則無法完成。一是他們發作品平台非常有限,不可能跟很多平台合作保護自己的原創。二是他們沒有精力去溝通。”劉思含說。

  近期,有平台推出一個叫做“維權賠付”的功能,意思是通過後台與平台方簽訂協議,如果遭遇抄襲由平台幫原創者維權。平台方先賠付50元,然後平台再幫原創作者走訴訟途徑維權。訴訟成功後,再賠付100元。

  “不管被剽竊的是什么內容,不管是視頻還是文字,都是同一個價格。簽訂這個協議,意味著平台按照固定的價格賠付作者。然而,制作漫畫和視頻的成本高於純文字的內容,我們認為這個賠付金額太少了。如果不簽協議,我們確實不會走訴訟的途徑。”劉思含說。

          記者:張昊

[责任编辑:潘洁]
网友评论
相关新闻