教育教学 | 21.4M
语言:简体
3 .0
应用简介
反抄袭系统是一种比较源文档与目标文档之间的相似度并给出相似度结果的信息处理系统。通过混合引擎覆盖约188 亿个网页和490 万篇论文。系统采用自主研发的ROSTWebSpider和ROSTSEAT算法,实现对互联网和部分期刊网络的广泛覆盖。
反抄袭系统是一种比较源文档与目标文档之间的相似度并给出相似度结果的信息处理系统。武汉大学信息管理学院出版学系教师沉阳副教授开发的ROST文档相似性检测工具(有时也称为相关性检测工具,以免过于敏感)可以有效检测论文中的抄袭相似性。文件。经过六年的研发(早期版本被称为Internet Pirate Buster)终于推出了6.0版本。在定稿过程中,我们收到了武汉大学多位专家教授的宝贵意见。目前已经有约20家单位测试使用,反响良好,在一定程度上杜绝了可能抄袭的论文发表。
特征
rostcm主要包括三部分:全网检索、本地文献数据库比较和少量文献比较。
软件栏目包括聊天分析、网络分析、网站分析、浏览分析、微博分析和期刊分析。
通过这个系统,我们可以判断一篇论文是否抄袭。在分析论文是否抄袭时,还可以进行功能分析(词频分析、英语词频分析、中文词频分析、社交网络和语义网络分析、情感分析、流量分析、TF/IDF批量词频分析、相似性分析),这使得抄袭论文无处藏身。
基本的:
反抄袭软件自动将文档切割成50到200字的多个小文本(可定制),并使用混合引擎将其与188亿个网页和490万个文档进行模糊匹配,标记每个文本块与文档的最大相似度图书馆中的一些文件。从这个软件中,软件计算出相似度95%(基本抄袭)和相似度80%(稍加修改的抄袭)的单词占总单词数的比例。我们使用这个比率作为抄袭(相似性)的衡量标准。
系统需要XP系统和word2003环境。优点覆盖范围广,通过混合引擎覆盖约188亿个网页和490万篇论文。系统采用自主研发的ROST WebSpider和ROST SEAT算法,实现对互联网和部分期刊网络的广泛覆盖。
模糊检测,灵活匹配。为了防止抄袭者替换一些字符、删除一些标点符号,系统根据相似度进行判断。系统采用自主研发的ROST Like算法,实现高速相似度检测和测量。系统采用自主研发的QingQing算法提取信息指纹。在P3和512MB PC上,分词速度为13MB/S。网上已提供评估版供业界评估。
本软件的检测结果只能作为参考。您可以在表格上单击鼠标右键,导出详细的巡检结果并发送给被巡检人员。本软件不做是否抄袭的结论。它只告诉你与现有文献相似度超过80%的文本比例。总比例是多少。相似度高于80%的文本才是需要关注的。低于此的值可以完全忽略。
规范删除引文和参考文献,减少误判的可能性。
定制的块检测机制准确表示文章的每个文本块与其他文档之间的相似度。每个文本块的范围约为50 到200 个单词(可定制)。红色表示极度相似(相似度大于80%),一目了然,清晰醒目。当设置为每块50 个单词时,可以在较低的信息粒度下找到潜在的抄袭或类似文档。
相似文档模块追踪技术可以通过简单的操作直接定位相似文档中的哪些内容被抄袭或复制,直观、清晰。
结果分析功能自动分析文献的相似结果并给出评价意见。
支持多种文件格式,包括PDF、DOC、PPT、XLS、TXT等文档。
专有数据文件保存,无需反复检查,浪费时间。缺点这个反抄袭系统无法覆盖全球所有中英文文献。覆盖率和召回率之间的相关性正在研究中。
检测时间稍长。该软件每检测200个单词需要7秒的时间。一份8,000 字的文档至少需要5 分钟左右。这需要一点耐心。
该软件的检测结果存在小误差。使用较小的文档块进行检测可以减少错误,但所需的时间也会相应增加。经过我们在多家编辑部的尝试,版块大小定为200字。合适,此时错误率可以接受,文档相似率一般会低于实际。
热门攻略