Софтуер за сравняване на текст
Здравейте на всички.
Имам нужда от софтуер, сравняващ текста от два документа. Желателно е да дава процентно съвпадение или съвпадение в някакви други единици, в момента не ми идва на ума какви.
Причината за нуждата ми е съвсем тривиална.
Дъщеря ми си изкарва по някое евро, пишейки курсови работи на по-мързеливите си състуденти. В случая на английски, но предполагам, че езика е без значение за софтуера.
И тъй като освен нейните проекти, пише и още два, три и повече, неизбежно е неволно или "подсъзнателно" работите да не си приличат поне стилово.
Проектите се качват online и софтуер на сървъра ги сравнява за плагиатство. Не приема работи с до определен процент съвпадение, като изписва на кой проект прилича съответната работа.
Базата е за години назад.
Та преди да ги качи, желае да прави някаква проверка, все пак прави някаква услуга и резултата от нея не трябва да е отрицателен.
Моля ви, не желая морални напътствия.
Ако някой има работещо решение, нека да сподели, няма значение дали софтуера е платен или free, интересува ме само името и версията.
Ще се инсталира на Windows Vista Enterprise.
Благодаря на всички предварително и весел уикенд.
Re:Софтуер за сравняване на текст
Re:Софтуер за сравняване на текст
Още един глас за WinMerge що се отнася за сравняване на файлове въобще и в астност текс. Само не знам как ще сработи с останалите изисквания. Има го и в portable версия.
Re:Софтуер за сравняване на текст
Тези обикновените diff програми ме съмнява да вършат работа, в случая не става дума за сорс код или копи/пейст. Тези програми търсят съвпадения ред по ред дума по дума символ по символ. В случая доколкото разбирам не е копирано едно от друго, а понеже ги е писал един и същи човек имат еднакъв изказ и ползва еднакви словосъчетания волно или неволно. Съмнява ме силно такива програми да се разпространяват безплатно или комерсиално за широка публика. В едно съм сигурен обаче трябва да търсиш нещо далеч по сложно от обикновена diff програма
разгледай това http://www.hackerfactor.com/GenderGuesser.html#Analyze не е каквото ти трябва но все пак ползва някакви критерии за да разпознае дали мъж или жена е писал този текст. Вероятно софтуера ползва подобен алгоритъм в комбинация с още други
а и още нещо, езикът има значение за такива обработки
П.С намерих още едно което вероятно ще ти свърши повече работа но не ми се занимава да го тегля и подкарвам. http://www2.eng.cam.ac.uk/~farm2/per...ecognizer.html
Re:Софтуер за сравняване на текст
Благодаря на всички, ще тествам предложенията ви и ще ви пиша пак.
Разбира се, приемам и още такива.
Лошото е, че дъщеря ми няма възможност да узнае кой и какъв софтуер прави проверката на сървъра. Нито пък какъв алгоритъм използва.
Но така или иначе, неприетите работи не се анулират, а се отхвърлят за доработка.
Респективно, тя може да ги тества онлайн и да сравнява кой софтуер от предложените ще даде най-близък резултат.
И се замислям какъв може да е този софтуер. Прави сравнение години назад, огромно количество студенти и предимно сравнява текст, говорим за юридически казуси, мазни локуми на английски, с доста специфични термини и словоред.
Re:Софтуер за сравняване на текст
Значи лека закачка с гугъл ме наведе на мисълта, че това което дефакто @Malone търси не е наистина обикновенно текстово сравняване.
Правилната насока за търсене е "plagiarism scanner", "authorship identification software", "plagiarism checker", "academic plagiarism detector" и т.н.
Нетът докладва, че водеща в тази област е програмата Тurnitin това пък ме доведе до http://www.scanmyessay.com/turnitin.php
Надявам се че е добра отправна точка.
Re:Софтуер за сравняване на текст
Нов Български Унииверситет от тази година работят с тази система за оценка на плагиатството.
Всъщност тя не оценява, а търси и сравнява тектовете - като събира накрая общ процент на местата от които е копирано.
Системата е уникално тъпа, защото при еднакви текстове с допустимо количество синтактични или дидактични грешки не приема плагиатство. От дрега страна от опита ми с нея знам, че и смяната на времето в текста има същия ефект.
https://api.turnitin.com
https://turnitin.com
http://turnitin.com/resources/docume...API_Manual.pdf
ПП. Разликата между тази ситема и Viper е огромна. Вчера отделих 2 часа на Vaiper-a , но тя не работи с кирилица , нито пък ползва системата на Гугъл за машинен превод и сравняване на текстовете. Систематана Turnitin напротив ми показва дори текстстове от китаиски блогове, които съм привел механично и леко съм напаснал към българския словоред.
Темата много ми харесва и бих продължил опитите с подобни софтуери с чисто "научна цел" :)
Re:Софтуер за сравняване на текст
Ето какво ползва Гугъл (или поне отчасти понеже притежава този продукт и имаше спекулации на времето че го е купил точно с цел да им използва алгоритъма): http://www.copyscape.com/
Ако има хора работещи в SEO сферата тук те може би биха били по-полезни понеже знам че там масово се копира и "променя" текст за да мине пред търсачките като уникален затова предполагам и че са наясно с това какъв софтуер съществува.
Отговор: Софтуер за сравняване на текст
Един скромен уеб инструмент за копирайтъри, който сравнява два текста на ниво думи и показва разликата в проценти.
Отговор: Софтуер за сравняване на текст
Някой може ли да ми прегледа един текст и да види колко процента съвпадение има? Например по системата, както колегата горе спомена, че НБУ имат тази програма turnitin.
Отговор: Re:Софтуер за сравняване на текст
Здравейте!
Аз имам скорошен опит с Plag.bg, тъй като са нови за България, но софтуерът е точен, дава възможност дори за многоезична проверка и перифразиране.
:thumbsup:
Отговор: Софтуер за сравняване на текст
Здравейте, да се включа и аз!
Доколкото имам информация от студентските асоциации, plag.bg е добър инструмент за проверка на плагиатство. Доста бързо дава резултат от проверката с индикации за корекции.
Отговор: Софтуер за сравняване на текст
Да, pharalanov, аз съм студентка в ИУ-Варна и отскоро използваме този софтуер. Особено ми е полезен при проверката на източниците, които цитирам. Дори директно изпращам документа с доклада за уникалност.Имам колеги, които го използват и при content writing. :thumbsup:
Отговор: Софтуер за сравняване на текст
Още един рекламиращ да очакваме ли?;)
Отговор: Софтуер за сравняване на текст
Е, още не е превалила средата на месеца, само с две регистрации ли очакваш да минем ;)