网络“洗稿”调查:网站软件“秒洗”,写手规模接单千字十元
澎湃新闻记者 赵思维
王兴(化名)称自己写的文章再次被“洗稿”了,同领域的自媒体博主将他文章中的语句调整后,改头换面又发了一遍。他有些无奈,再次打开了投诉页面。投身育儿领域自媒体创作多年,王兴自称多次被“洗稿”,他自嘲重新认识到汉字的博大精深。
王兴的遭遇并非孤例。2021年1月初,澎湃新闻(www.thepaper.cn)经过连日调查发现,目前市面上仍存在“洗稿”生意链,“人工+机器”的双轨“洗稿”模式,使诸多原创文章被“拆解拿走”。
“洗稿”软件和一些做“伪原创”的网站称可在不改变语意的情况对文章进行分词,自动对段落中的文字顺序调整、对词语删减替换,实现“洗稿”。此外,写手活跃在网络平台,规模承接“洗稿”业务,按照千字10元至三四十元不等的价格获取酬劳。有的“工作室”甚至会大量招募兼职写手,并培训“洗稿”技巧及规避平台原创度检测的方法。
这俨然成为一场“猫和老鼠”的游戏。虽然自媒体平台及监管层持续打击,但“洗稿”侵权在自媒体领域犹如顽疾。
2020年11月11日,新修订的《著作权法》正式发布,并将于2021年6月1日起实施。
就此,长期关注知识产权保护的北京市中闻律师事务所顾问刘彬向记者分析,新版《著作权法》亮点在于“提高法定赔偿额”和引入“惩罚性赔偿制度”,对可能产生的侵权行为具有震慑作用,相当于戴上了“紧箍”。
网上有多种“洗稿、伪原创”工具
“付费会员的伪原创度可以达到‘100%’”。名为“奶盘网”的“文章采集伪原创”网站客服如此告诉记者。
名为“奶盘网”的“文章采集伪原创”网站宣称对免费用户降低到50%的伪原创度。但与客服交流后,对方告诉记者,付费会员的伪原创率可以达到“100%”,实现彻底“洗稿”。
这个看起来有些简单的网站有文章采集、伪原创等功能。“用伪原创工具可以把在互联网上复制的文章瞬间变成您自己的原创文章。”为招揽客户,该网站在首页写道,软件采用一定的分析规则和算法分割文章,有同义词替换词库,可以在不改变文章语义的前提下生成原创文章。
记者随机输入一篇4870字的原创新闻,使用“伪原创”功能,系统将文章分析后“切词”3258个,免费用户随机替换230个,升级会员可替换503个。对比原始素材,“伪原创“后的文章将“讲述”改为“叙述”、“中国”改为“我国”、“建立”改为“树立”、“探索”改为“探究”等,进行了近义词替换。
客服告诉记者,他们的客户来自各行各业,自媒体从业者居多。
这只是冰山一角。
近日,记者以“洗稿软件”、“伪原创工具”、“洗稿机器”等关键词在百度检索,获得多个推介有相应功能软件的网帖或网站。网帖一般会打广告,需添加底部的微信或QQ细聊;网站或直接提供在线服务,或需下载推荐的软件使用。
在声称可一站式进行文章采集、原创发布的平台“牛蚁写作”上,记者测试发现,输入关键词即可从头条、知乎、百家号等平台获取文图写作素材。记者输入“落雪”,将随机检索到的一篇672字散文添加到文章库,接着使用“一键原创”功能,一秒钟后,这篇672字的散文变为718字。
对比原文章,“智能原创”后的文章添加、删减及替换了部分原有名词、动词、副词、形容词,几乎每一小段都进行了改动。
如原文章“安祥、宁静的校园内,犹如一位公益慈善的老人,闭着蒙眬的双眼,雪花跳上他长满皱褶的脸,最终变成了他的胡子与眼眉,静静的眺望远处。”这句话经过“智能原创”后,变为了“安详、静谧的校园,犹如一位慈善的老者,闭着蒙眬的眼睛,雪花跳上他爬满皱纹的脸,最后变成了他的胡须与眉毛,静静地遥望远方。”
“改造后文章的伪原创度能达到80%左右,理论上可以达到100%。九成的客户基本上可通过平台原创度检测。”当问及伪原创度能达到多少时,牛蚁写作一名负责技术的刘姓工作人员这样告诉记者,称不用担心被平台检测发现抄袭。
除了上述网站,还有“洗稿”软件。
名为“自媒体洗稿软件AI版”的软件宣称,保证通过自媒体平台原创检测,适用于头条号、企鹅号、搜狐号等自媒体平台,“2秒一键智能洗稿”。
名为“自媒体洗稿软件AI版”的软件宣称通过软件“洗稿”,可通过自媒体平台原创检测。本文图均来源澎湃新闻记者赵思维
记者随机输入一篇4866字的原创新闻,使用“洗稿”功能后对比发现,改造后的文章对几乎每一句话添加、删减了名词、副词、动词,部分名词则用近义词替换。
“它会抓取全网阅读播放量高的内容,把文字打散重组,避过平台由机器判定的抄袭审查,从而完美符合平台的‘优质稿件’标准。”另一“洗稿”软件如此自我介绍。
有人招募写手批量接单“洗稿”
2020年11月23日,张琳(化名)在百度贴吧“写稿吧”发了条帖子:“千字十元,洗稿接单了,原创度要保证70%。”很快,下方多个用户向其留言问联系方式,张琳留下了自己的微信号。
有用户百度贴吧“写稿吧”发了条帖子:“千字十元,洗稿接单了,原创度要保证70%。”
在闲置物品交易平台“闲鱼”,声称承接“洗稿”业务的奇猫工作室打出“代写自媒体百家号、企鹅号、头条号、大鱼号各大领域文章,千字6块,100篇起做”的广告,广告下方还配上一张“洗稿”后在百家号发布的后台图片。
添加微信后,一名徐姓写手发来4篇涵盖历史、科技、电影话题的“洗稿”文章,均发在百家号。他告诉记者,他们工作室专门承接“洗稿”业务,一般会接机构的商单,300篇起,每篇800字加6张图,40元/篇。
徐姓写手称,除了汽车领域相对困难些,科技、历史、旅游、三农、星座、职场、娱乐、情感等领域都可以“洗稿”,情感领域“洗稿”爆款多。“给你可以低到千字4.5元/篇,但不配图。”
根据该写手的说法,客户指定话题或领域,他们搜集素材,人工“洗稿”。“洗稿”后会进行文章原创度检测,基本能达到60%左右,可以通过自媒体平台的原创检测,不会被认定抄袭,个别文章通过不了,他们也会返工修改。
记者以 “洗稿接单”、“自媒体洗稿”、“伪原创洗稿”等关键词检索发现,在百度贴吧、豆瓣、QQ、闲鱼等平台上存在大量相关广告网帖和社群。
在“豆瓣”出现的“洗稿”广告网帖。
在闲置物品交易平台“闲鱼”,承接“洗稿”业务的奇猫工作室打出广告“代写自媒体百家号、企鹅号、头条号、大鱼号各大领域文章,专业写手,千字6块,100篇起做。”,广告下方配上一张在“洗稿”后在百家号发布的后台图片。
名为“写手代写接单放单”的QQ群有1975名用户,时常保持在1400余人在线。记者加入的几天内,不断有成员在群中发布代写、“洗稿”的任务,寻找写手,有意者会通过添加QQ私聊。名为“壮”的用户发布消息,称需要电影解说写手,可以“洗稿”,也可以原创;名为“肖申克的九叔”的用户也在招募写手,称需要体育领域的“洗稿”,不限量。
有用户发布消息,称需要电影解说写手,可以“洗稿”,也可以原创。
招募写手,称之为放单,放单后就会有人接单。
记者粗略统计,仅在QQ平台,承接“洗稿”接单放单的社群达几百个,“洗稿”文章范围涵盖汽车、医疗、娱乐、游戏、影视等领域。
名为“长期医疗伪原创稿件编辑群”的134人QQ群长期招聘兼职写手,负责“洗稿”医疗类文章,每篇600字左右,佣金3.5元,原创度要达到65%。群主将“洗稿”的过程叫做“复制项目”。“每天复制上百篇不是问题。”群公告介绍。
群主发给记者一个“腰椎骨折便秘怎么办”题目,称试稿通过后才能注册领取任务,试稿前,群文件中有关于“伪原创”流程和技巧的文章及对应视频资料,新人要先学习。
其中一篇文章详细介绍如何在伪原创编辑平台领取任务,以及采集网上素材、取标题、写正文、格式注意的方法。
另一个声称负责给一些网站提供问答内容的医疗类伪原创QQ群,长期招聘兼职写手,目前已有453人,群主会组织成员在名为“七色彩虹”的平台“洗稿”。
群文件中,分享了20余篇讲如何“洗稿”的文章。其中一篇文章还特意强调了平台原创度检测的规则,提醒如何避开检测。
记者粗略统计,仅在QQ平台,承接“洗稿”接单放单的社群达几百个,“洗稿”文章范围涵盖汽车、医疗、娱乐、游戏、影视等领域,“洗稿”后的文章几乎全部发布在自媒体平台,包括微信公众号、百家号、企鹅号、头条号、大鱼号等,客户报出的价格通常在千字十元至三四十元不等,“洗稿”文章都要保证通过自媒体创作平台的原创度检测。
记者调查发现,散客写手只能承接少量单子,批量“洗稿”单一般会被“工作室”吞下,“工作室”接单后会招募写手兼职“洗稿”,系统培训“洗稿”技巧。由于被平台或粉丝知晓“洗稿”,对下单的自媒体博主来说是风险,散客写手和“工作室”对客户的信息保密,一般“工作室”都有长期稳定的客户。
“剑网2018”曾专项整治“洗稿”式剽窃
王兴(化名)3年前涉足自媒体领域,所专注的育儿领域每周更新文章三次,目前在微信公众号、头条号、百家号的粉丝加起来超百万。
谈起“洗稿”,王兴觉得很无奈,他称优质文章被其他自媒体账号“拿去”多次。“你写的这段话,他就给你变换个说法,你摘取的多个案例,他给你调整下顺序。”发现被“洗稿”,王兴会私信那些自媒体账号质问为何要“洗稿”,但对方往往不承认。投诉给文章所在自媒体平台,但不一定都被认定为“洗稿”,王兴自嘲“重新认识到汉字的博大精深”。
根据记者调查和近年来网上曝光的案例,目前“洗稿”现象频发于自媒体领域,为原创作者所诟病。
这一现象也引起监管层的关注。近年来,国家版权局、工信部、公安部、国家互联网信息办公室多次开展网络侵权盗版“剑网”专项行动,每一次专项行动会结合这一时期权利人和群众反映强烈的网络侵权问题,针对性开展整治行动。
“剑网2018”专项行动中就明确将“整治自媒体通过‘洗稿’方式抄袭剽窃、篡改删减原创作品的侵权行为,着力规范搜索引擎、浏览器、应用商店、微博、微信等涉及的网络转载行为”列入整治范畴中。
除了监管层,治理“洗稿”,自媒体平台是重要一环。平台解决投诉、打击“洗稿”行为的方式态度往往决定了该平台“洗稿”现象是否频发的关键。
记者注意到,在微信公众号的文章投诉页面,对抄袭行为的认定包含“通过特殊方式整合他人原创内容、明显‘洗稿’他人原创内容、大篇幅引用他人原创内容及直接搬运他人原创内容”的情形。
在微信公众号的文章投诉页面,将抄袭行为的认定包含“通过特殊方式整合他人原创内容、明显“洗稿”他人原创内容、大篇幅引用他人原创内容及直接搬运他人原创内容”的情形。
对此,微信方面向记者表示,经平台审核,按现有法律可明确界定的较为明显的抄袭或“洗稿”内容,平台将直接删除,并根据综合违规情况对其帐号进行相应处理。对原创性有争议的内容,通过“洗稿投诉合议小组”合议的方式认定为“洗稿”。
“今日头条”头条号平台相关负责人认为,一些创作者通过“同义词替换、句式变化”等方式,增加了洗稿内容识别和判定难度。当确认稿件是对他人原创内容进行删减、修改后拼凑制成,内容行文逻辑、核心观点照搬原文或与之多处相似,平台都认定该行为是“洗稿”。
就记者在调查过程中发现的百家号文章“洗稿”、写手批量“洗稿”给“百度知道”回答问题、贴吧出现的“洗稿”放单接单网帖等,记者现象向百度公关团队多次反馈,截至发稿,对方未回应。
专家:新《著作权法》给“洗稿”戴上“紧箍”
“洗稿”,一般指采用同义词更换、语序转换、段落变换、增删非关键词语等手法生产内容,导致与他人作品主题、观点、逻辑、表达等方面存在“实质性相似”,伤害原创者的利益,违反平台运营规范的行为。
与之意思相近的“抄袭”,一般指未经著作权人同意,又无法律上的依据,擅自将他人作品或者作品的片段照抄、照搬或套用的侵犯他人著作权的行为。
记者注意到,“洗稿”和与抄袭剽窃的性质是否一样,各方有着不同看法。
对于二者异同,在《中国新闻出版广电报》的报道中,武汉大学知识产权高级研究中心副主任王清认为,“洗稿”与剽窃本质上无差别,如果一定要说差别的话,只能说一个是行业术语,一个是法律术语。华中科技大学法学院教授熊琦也认为,如果严格从《著作权法》的角度来分析,“洗稿”行为本质上就是抄袭。
但华东政法大学知识产权学院教授丛立先认为,从目前大家所了解的“洗稿”行为来看,并不等同于抄袭剽窃。“洗稿”行为可能是抄袭剽窃,也可能是非法演绎,还可能是合理使用,亦可能是借鉴创意思想的新创作,而抄袭剽窃只是“洗稿”行为当中的一种。
随着自媒体作为一种新的传播方式兴起,加大对“洗稿”侵权治理的声音愈加高涨。
在司法实践层面,2020年12月底,浙江杭州市余杭区人民法院就审理了一桩利用“洗稿神器”抄袭他人文章成果的案件。
原告方腾讯诉称,被告快忆公司通过其运营的网站向公众提供“后羿采集器”软件服务,使用“后羿采集器”可实现对微信文章的采集、反屏蔽、洗稿及自动导出等功能,经“后羿采集器”“洗稿”后的文章,与原文相比,仅在内容上进行了同义词替换、语序转换等操作,文章的主题、观点、逻辑、结构等均高度相似。腾讯方面认为,该行为构成不正当竞争,诉请快忆公司停止侵权,并赔偿经济损失及合理费用490万元。
法院一审后认为,“后羿采集器”所进行的“伪原创”处理只是对已有文章的简单同义词替换、语序调整,文章段落结构与段落基本表达内容不变,本质上仍然属于抄袭。判决被告停止通过“后羿采集器”提供“伪原创”服务,并赔偿腾讯公司经济损失及合理费用10万元。
就此,杭州市余杭区人民法院知识产权审判庭庭长成文娟在接受媒体采访时表示,余杭法院作出这一判决,从司法角度明确了提供“洗稿”软件服务属于不正当竞争行为,给“洗稿”现象敲响了警钟。
记者注意到,2020年11月11日,新修订的《著作权法》正式发布,并将于2021年6月1日起实施。作为法律关系最为复杂、调整主体众多、社会牵扯面最广的一部知识产权专门法,著作权法的修订备受社会关注。
法律学者王琳发布在《新京报》的撰文分析,从本次修订的具体内容来看,聚焦的多是司法实践中亟待解决的现实问题,有很强的针对性。新《著作权法》有不少亮点,源于司法实践中已被广为接受的解释或惯例。如很多机构媒体和优秀的自媒体人苦于被一些无良媒体以“搬运”、“洗稿”的方式大肆侵权已久。
“‘搬运’、‘洗稿’只是众多侵权乱象中的冰山一角。灰色产业之所以能够在黑白之间运行,多数时候并不在立法不明确,而在执法不严格。”王琳认为。
长期关注知识产权领域的北京市中闻律师事务所顾问刘彬也向澎湃新闻分析,此次修订新版《著作权法》亮点在于“提高法定赔偿额”和引入了“惩罚性赔偿制度”,对可能产生的侵权行为具有震慑作用,相当于戴上了“紧箍”。
刘彬说,对于故意侵权、侵权情节严重的情况,法院可以判决给予权利人的实际损失、侵权人的违法所得、权利人的权利使用费的一倍以上五倍以下的倍数赔偿。同时还将法定赔偿数额的上限从50万元提高到500万元,并设定了法定赔偿额的下限500元。
(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)
【编辑:黄钰涵】