Kompletní průvodce k odhalení plagiátorství AI Chatbota

AI Chatboti jako ChatGPT se neomezují pouze na odpovědi na vaše otázky. Mohou psát lidské e-maily, motivační dopisy, eseje, poezii, blogové příspěvky a mnoho dalšího.

Psaní pomocí umělé inteligence je jako chameleon – dokáže splynout s jakýmkoli jiným typem psaní tak dobře, že byste jen těžko poznali rozdíl.

Bohužel to pro nás lidi neuvěřitelně ztěžuje odhalit, kdy AI něco napsala místo osoby. Jistě, všichni bychom mohli přijmout radu Sherlocka Holmese a „eliminovat nemožné“, ale kdo na to má čas?

Co když vám řeknu, že výše uvedený odstavec napsal AI? Ano, požádal jsem YouWrite, aby napsal rychlý úvod k tomuto příspěvku, což je to, s čím přišel. Docela přesvědčivé, že? To je ten problém, je příliš přesvědčivé, že to někdo může prezentovat jako své vlastní dílo, aby z toho měl užitek.

AI nejen přeformulují obsah; učí se téma a prezentují ho přirozeným jazykem pomocí RLHF. To znamená, že generovaný obsah nebude při čtení robotický ani jej nelze porovnat s údaji dostupnými online, aby bylo možné zachytit plagiát.

Chytání obsahu generovaného umělou inteligencí není snadné a nebudu vám dávat falešnou naději, že jej dokážete zachytit se 100% přesností. S trochou detektivní práce a pomocí nástrojů pro detekci psaní AI však můžete většinu děl AI zachytit.

Níže naleznete ruční způsoby odhalování plagiátorství AI a také některé automatické nástroje.

Table of Contents

Ručně zjistěte plagiát AI 🕵️

ChatGPT není ani velký problém, pokud jde o plagiátorství AI. Existuje mnoho alternativních nástrojů, které jsou založeny na stejné technologii GPT-3 a jsou vytvořeny pro psaní. Ty jsou velmi pokročilé a speciálně vyrobené pro vytváření obsahu podobného lidem, který je obtížné zachytit.

Automatické detekční nástroje jsou v závislosti na typu obsahu, délce a složitosti trochu hit nebo chybějící. Takže alespoň v současné době je nejlepším způsobem ruční spojování teček, abyste zjistili, zda je zápis generován AI nebo ne.

Níže jsem uvedl některé běžné vodítka, které byste mohli hledat, abyste zachytili obsah generovaný AI.

Jak zajistit, aby byl váš domov Google v noci tišší

#1. Zastaralé informace

ChatGPT a další umělá inteligence založená na GPT-3 se na konci roku 2021 omezila na znalosti. I když někteří roboti AI mají vestavěný vyhledávač, aby vyhledávali nejnovější informace, stále se spoléhají na stará data při psaní dlouhého obsahu, jako je eseje nebo blogové příspěvky.

Pokud si všimnete, že zápis neustále mluví o zastaralých datech, konkrétně před rokem 2021, pak by to mohlo být generováno AI.

Na níže uvedeném snímku obrazovky jsem požádal YouWrite, aby mi řekl o nedávném mistrovství světa ve fotbale, a to je to, s čím přišel.

Hovoří o mistrovství světa ve fotbale 2018 namísto toho nedávného v roce 2022. I když je nástroj aktualizován, aby hovořil o nedávných událostech, jako je mistrovství světa ve fotbale 2022, pro psaní dlouhých příspěvků stále používá zastaralá data, na kterých je postaven.

#2. Pro popisy používá stejnou strukturu vět

Při psaní popisů více produktů/aplikací AI obvykle používá stejnou strukturu vět, kterou upravuje tak, aby vyhovovala popisu produktu. Popisy obvykle začínají stejným slovem, například The, It, A nebo názvem produktu. Popisy mají také vyhrazené zaměření, které se opakuje.

Například níže jsem požádal ChatGPT, aby mi řekl o „webech pro zadávání dat“. Můžete vidět, že všechny popisy začínají na „A“ a mají přesné zaměření.

Také jsem položil YouChat stejnou otázku a udělal to totéž a na začátku zopakoval název každého webu a samotné popisy vypadají jako přeformulovaná verze každého z nich.

Pokud má zápis, který analyzujete, popis čehokoli podobného charakteru, je to skvělý způsob, jak zachytit AI psaní.

#3. Používá krátké věty

U většiny zápisů bude AI používat jednořádkové věty maximálně s jednou čárkou. Možná se snaží minimalizovat možnost chyby, ale vyhýbají se psaní dlouhých vět, které by mohly vyžadovat použití dvojteček, středníků nebo silných vodorovných čar.

Vím, že to není nejlepší vodítko k zachycení psaní AI, ale stojí za to zvážit, abyste své podezření dále prokázali.

#4. Může poskytnout nesprávné informace

U složitých otázek, které obvykle zahrnují nějaký druh pokynů, může AI neporozumět záměru a poskytnout nesprávné informace. Nemluvím zde o zastaralých informacích, jen vám sebevědomě řeknou špatné informace, když nerozumí tématu.

Například jsem požádal YouWrite, aby mi řekl „jak rootovat telefon Android bez počítače“. Stále mi to ukazovalo metody, které zahrnují použití PC v určité fázi výuky.

#5. Nepřidává osobní názor

Když o něčem mluví, umělá inteligence mluví jen o známých faktech. Na rozdíl od lidí s ním nebude mluvit o své osobní zkušenosti. Ačkoli AI mohou být instruováni, aby vytvořily praktický zápis, mají tendenci se tomu ve výchozím nastavení vyhýbat.

Jak opravit flash disk, když se soubory stanou zkratkami (ŘEŠENÍ)

Pokud si všimnete, že zápis mluví pouze o dobře známých faktech, je velká šance, že jej napsala umělá inteligence. Například když mluvíme o aplikaci, bude mluvit o jejích funkcích, místo o tom, jak hladká je navigace nebo jak aplikaci skutečně používat.

#6. Stručná vysvětlení

Protože AI jsou omezeny aktuálně dostupnými znalostmi, mají tendenci psát stručná vysvětlení a popisy. Podle mých zkušeností, pokud mluví o konkrétním tématu – jako je rootování Androidu – udržují vysvětlení v rozmezí max. 2-3 odstavců. A u věcí, jako jsou aplikace nebo produkty, popis obvykle nepřesahuje 1 odstavec.

Lidé mohou o něčem psát do hloubky, včetně funkcí, omezení, osobních zkušeností, cen atd. Na druhou stranu se AI obvykle zaměřuje na hlavní rysy nebo přednosti, takže popis je také krátký. Pokud se instruktor zeptá na další podrobnosti, výrazně se zvyšuje šance na nesprávné informace.

#7. Zkontrolujte historii spisovatele

Pokud jako učitel nebo webmaster máte přístup k předchozí práci nebo úkolům autora, může být dobré je porovnat s textem, který vám je podezřelý. Je vysoce nepravděpodobné, že by spisovatel měl podobný styl psaní jako umělá inteligence. I když umělá inteligence může měnit tóny psaní, ale styly, které volí, jsou spíše obecné a nedokáže zkopírovat váš tón.

Vezměme si příklad odstavce vygenerovaného AI v úvodu tohoto příspěvku. Každý, kdo četl mé předchozí příspěvky, snadno vidí, že můj styl psaní je ve srovnání s ním úplně jiný.

Stačí si přečíst 2-3 předchozí díla spisovatele a zjistit, zda odpovídá stylu psaní podezřelého zápisu.

Nástroje pro detekci AI plagiátorství

Existuje spousta dostupných nástrojů, které dokážou detekovat obsah psaný AI. Jejich přesnost se však od sebe liší a může selhat v závislosti na typu obsahu a délce.

Testoval jsem tyto nástroje pomocí různých typů obsahu generovaného ChatGPT, GPT-3 Playground, WriteSonic, Rytr a YouWrite. Podařilo se jim detekovat všechny typy obsahu generovaného ChatGPT a GPT-3 Playground.

Ačkoli měli smíšené výsledky pro specializované nástroje pro psaní, je zajímavé, že všechny nedokázaly detekovat YouWrite, hádám, že je to proto, že YouWrite dělá chyby podobné lidským, aby se vyhnul detekci.

Doporučuji vám používat tyto nástroje spolu s ruční kontrolou obsahu. Nejprve analyzujte obsah pomocí některého z těchto nástrojů a poté ručně vyhledejte nějaké stopy, abyste podezření dále potvrdili.

Jak sdílet obrazovku Netflix na Discordu

Níže uvádím ty, které nabízejí nejlepší výsledky a které se nejsnáze používají:

Poznámka: Pro demonstraci použiji vygenerovaný text z WriteSonic na „Výhody manga“.

#1. Obsah ve velkém měřítku

Zjistil jsem, že detektor obsahu AI od Content At Scale je nejpřesnější pro většinu testů, které jsem provedl. Umožňuje skenovat až 2 500 znaků na skenování a vytváří procentuální předpověď ukazující skutečnou nebo falešnou hustotu obsahu.

Obsah, který je z více než 60 % falešný, lze s jistotou předpokládat, že je napsán obsahem umělé inteligence, alespoň většina. Na níže uvedeném snímku obrazovky můžete vidět, že 96 % obsahu je falešných, což jsem plně vygeneroval pomocí AI.

#2. GPTZero

Pokud chcete přesně vidět, jaký obsah generuje AI, pak je GPTZero dobrou volbou. GPTZero nehodnotí obsah. Místo toho zdůrazňuje přesný obsah, který pravděpodobně generuje AI.

I když ukazuje skóre zmatenosti a burstity, abyste získali představu o náhodnosti v textu, co je důležitější, podporuje 5000 znaků na sken a může také nahrávat soubory. Skenování velkého obsahu výrazně pomáhá zlepšit přesnost.

#3. Výstupní detektor GPT-2

Tvůrci ChatGPT také nabízejí bota pro detekci jejich vlastní práce. Protože GPT-2 a GPT-3 se liší pouze v celkových datech používaných pro trénink, tento detektor GPT-2 funguje dobře i pro AI založené na GPT-3.

Neexistuje žádné omezení, kolik obsahu dokáže skenovat, takže je ideální pro detekci velmi dlouhého obsahu generovaného umělou inteligencí. Také jsem zjistil, že jeho přesnost je v pořádku, zejména u obsahu generovaného ChatGPT. V předpovědích se však trochu ztrácí, takže její výsledky považujte pouze tehdy, když ukáže více než 50 % obsahu jako falešné.

#4. Writer AI Content Detector

Výsledky Writer AI Content Detector jsou sporné při detekci obsahu z nástrojů pro psaní AI, ale funguje skvěle pro obsah generovaný ChatGPT. Na jedno skenování můžete naskenovat 1500 znaků a dokonce přidat adresu URL obsahu, pokud je již publikován.

U mého testovacího textu generovaného umělou inteligencí bylo uvedeno, že 94 % obsahu je vytvořeno lidmi, což je ve srovnání s jinými nástroji docela mimo. Přesto se stále vyplatí používat k detekci obsahu ChatGPT, zvláště pokud je již publikován.

#5. Návrh a cíl

Jednoduchý, ale výkonný nástroj pro detekci psaní AI. Podle mých zkušeností nabízí Draft & Goal podobné výsledky jako Content At Scale, ale nemá omezený počet slov, takže můžete skenovat dlouhé zápisy. Doba skenování se však prodlužuje podle toho, kolik obsahu skenujete.

U mého vzorového textu se uvádí, že 94 % textu je generováno AI.

Moje myšlenky 💭

Osobně si myslím, že AI help je ve skutečnosti skvělý způsob, jak odstranit spisovatelský blok, získat všechny informace na jednom místě a najít inspiraci. Nikdy by však neměl nahrazovat lidské psaní, protože umělá inteligence je omezena na již známé znalosti.

Můžete také prozkoumat některé nejlepší nástroje pro kontrolu plagiátorství, abyste zabránili kopírování.