27.1.2011

Plagiaatti oikeustieteen alalla

Jokohan Suomessa nyt nähdään ensimmäinen tapaus, jossa plagiointi johtaa yliopistossa myönnetyn tutkinnon purkamiseen?

Iltalehti raportoi tänään mielenkiintoisesta tapauksesta oikeustieteen alalta. Jo hyväksytyn lisensiaatintyön on todettu sisältävän niin paljon plagiointia, että kyseisen lisensiaatintutkimuksen ja sen perusteella myönnetyn oikeustieteen lisensiaatin tutkinnon purkua haetaan korkeimmalta hallinto-oikeudelta. Päätöksen tutkinnon purkamisen hakemisesta on tehnyt Turun yliopiston oikeustieteellisen tiedekunnan johtokunta kokouksessaan 14.12.2010. Iltalehti otsikoi juttunsa näin: Poliisipomo plagioi lisensiaattityönsä

Iltalehti esittää osittaisen kopion johtokunnan pöytäkirjasta. Kopiosta selviää, että tapausta varten asetettu tutkintaryhmä totesi kyseisen lisensiaatin syyllistyneen "vilppiin tieteellisessä toiminnassa. Vilppi täyttää tässä tapauksessa luvattoman lainaamisen eli niin sanotun plagioinnin tunnusmerkit." Iltalehti kertoo, että kyseinen lisensiaatti on "Helsingin poliisissa merkittävässä johtoasemassa työskentelevä rikoskomisario". Plagioinnin kohteeksi joutunut on myöskin Helsingin poliisissa työskentelevä henkilö, jonka Poliisiammattikorkeakoululle vuonna 2006 jättämää opinnäytetyötä on nyt plagioitu. Nyt käsiteltävänä oleva plagiointi on todettu lisensiaatintyössä, joka hyväksyttiin kesällä 2009. Vilppiepäilyä alettiin tutkia pian sen jälkeen, joten tutkinta näyttää kestäneen puolitoista vuotta! Tutkinnan kerrotaan lähteneen liikkeelle, kun yliopisto sai asiasta ilmoituksen "ulkopuolelta".

Selvityksen mukaan plagiointi johtui vain lisensiaatintutkinnon laatijasta itsestään, eivätkä työn tarkastaneet kaksi professoria olleet tietoisia tarkastamansa työn sisältämästä plagioinnista.

Iltalehti on pyytänyt kommenttia myös rikosylikomisariolta itseltään. Rikosylikomisario kertoo toimineensa täysin tahattomasti, joten hänen mielestään koko tutkimuksen hylkääminen olisi kohtuutonta.

Mitä jatkossa?

Iltalehden raportoiman plagiointitapauksen käsittelyn myötä voisi kumoutua kaksi Suomessa vallitsevaa myyttiä:

Ensinnäkin, olen lukuisia kertoja ollut tilanteessa, jossa vain todetaan olkapäitä kohautellen, että jo hyväksytylle opintosuorituksena jätetylle plagiaatille ei voi enää tehdä mitään. Turun yliopisto on siis ensimmäisenä Suomessa osoittanut suoraselkäisyyttä tässä asiassa ja lähtenyt käsittelemään yliopistossa tapahtuvaa plagiointia oikeusvaltion periaatteiden mukaisesti. Vilppiin syyllistymisestä seuraa jotakin tekijälle itselleen (ei vain niille, jotka siitä ilmoittavat).

Toiseksi, nyt olisi mahdollisuus päästä eroon plagioinnin määrittelyissä ajoittain ja paikoittain kummittelevasta teemasta 'tahattomuus'. Plagiointi on luvatonta lainaamista: tekijä yksinkertaisesti ottaa tekstiä netistä tai kirjallisesta lähteestä eikä ilmoita alkuperäistä kirjoittajaa. Plagioinnin määrittelyyn ei siis kuulu pohdintaa tahallisuudesta tai tahattomuudesta. Tahattomuuteen vetoaminen toimii silloin kun kyseessä on vahinko, vaikkapa jos ikkuna särkyy siihen vahingossa osuneesta pallosta. Tekstin kopioiminen netistä tai kirjallisesta lähteestä tahattomasti on oikeastaan mahdotonta - ellei sitten uskota siihen, että jokin näkymätön voima ulkoavaruudesta liikuttelee plagioijan käsiä eikä hän itse tätä huomaa:)

23.1.2011

Hehheh, tiede voi olla tätäkin:)

Onko sinulla ollut vaikeuksia saada kirjoittamasi teksti julkaistuksi? Eikö artikkelisi kelvannut johonkin lehteen, ja jouduitko odottamaan referee-lausuntoja puoli vuotta? Tässäpä vaihtoehto, josta nykyinen suosikkiblogini Retraction Watch raportoi eilen.

Journal of Universal Rejection alkoi toimintansa vuonna 2009, vaikka sen nettisivut saivat muotonsa vasta äskettäin. Kun laitat artikkelisi tänne, lehti lupaa seuraavaa:
- sinun ei tarvitse hermoilla hyväksytäänkö artikkelisi vai ei, voit olla sataprosenttisen varma että sitä ei hyväksytä
- lehti ei laskuta sinulta maksua julkaisemisesta eikä varsinkaan sivumäärän mukaan
- voit sanoa että olet tarjonnut artikkeliasi maailman arvostetuimpaan lehteen (jos mittarina on tarjottujen artikkeleiden pieni hyväksymisprosentti)
- sinulle jää täydet tekijänoikeudet, voit muuttaa tekstiäsi ihan miten haluat ja tarjota artikkeliasi muuallekin, jopa ennenkuin kuin saat päätöksen julkaisemisesta
- päätös kuitenkin tulee yleensä heti, eikä kukaan edes lue tekstiäsi

Retraction Watch haastatteli Journal of Universal Rejection -lehden päätoimittaja Caleb Emmonsia eilen. Emmons kertoo tarinan lehden historiasta ja matemaatikkona määrittelee lehden impaktikertoimen lähestyvän ääretöntä.

14.1.2011

Retraction Watch: Onko tiedevilppi lisääntynyt?

Retraction Watch on Adam Marcusin ja Ivan Oranskyn ylläpitämä blogi, jossa seurataan vilpillisiksi paljastuneiden tiedeartikkeleiden poistamista julkaisuista ja julkisuudesta. Blogi on toiminut elokuusta 2010 lähtien; alussa blogin pitäjille vihjailtiin että eipä taida tulla paljoakaan julkaistavaa. Epäilijät olivat kuitenkin väärässä, raportoitavaa on riittänyt niin paljon, että kirjoittajat eivät ole pystyneet julkaisemaan tekstejä poisvedetyistä artikkeleista sellaisella aikataululla kuin olisivat halunneet. Kaikki tieteelliset lehdet eivät myöskään ole suhtautuneet asiallisesti, kun Marcus ja Oranski ovat kysyneet tietoja poisvetämisen syistä. "None of your damn business" tuli vastaukseksi lehdestä nimeltä Annals of Thoracic Surgery, kun Marcus ja Oransky kysyivät syitä siihen, miksi ko. lehdestä vedettiin pois siinä vuonna 2004 ilmestynyt artikkeli.

Retraction Watch -blogissa ilmestyi eilen kooste siitä, miten paljon tieteellisiä artikkeleita poistetaan julkisuudesta tieteellisen vilpin takia: Kirjoituksen otsikko on Is Scientific Fraud on the Rise? Ivan Oransky on koonnut tähän tekstiin tuloksia arvioista tieteellisen vilpin määrästä, kun mittarina käytetään artikkeleiden poisvetämistä. Vaikka julkaistujen vilppikäsittelyjen määrä on lisääntynyt, syyksi on arveltu tieteellisen julkaisemisen suurta kasvua (siis kun artikkelien ja lehtien määrä kasvaa, vilpillisten artikkeleiden määrä lisääntyy samassa suhteessa). Tässä blogikirjoituksessa viitataan analyyseihin, joissa on katsottu vuosittain poisvedettyjen artikkeleiden määrän suhdetta uusien julkaisujen määrään. R Grant Steen on julkaissut lehdessä Journal of Medical Ethics artikkelin Retractions in the scientific literature: is the incidence of research fraud increasing? Hän oli analysoinut 742 artikkelia, jotka oli vedetty pois PubMed -tietokannasta vuosina 2000 - 2010. Steen jakoi syyt petoksiin (sepittämimen, fabrication ja vääristely, falsification) ja virheisiin (error). Suurin yksittäinen nimetty syy artikkelin poisvetämiseen oli "tieteellinen virhe". Aineiston sepittäminen (fabrication), johon Steen luki myös aineiston plagioinnin, oli yleisempää kuin tekstin plagiointi. Steenin analyysi myös vahvisti monien epäilyt sitä, että vilpin määrä on lisääntynyt suhteessa enemmän kuin julkaisujen määrä. Steen ihmettelee epämääräisin syin poisvedettyjen artikkeleiden määrää, 8%:ssa tapauksia syytä ei ilmoitettu ja 18%:ssa tapauksia syyt olivat epäselviä tai moniselitteisiä (ambiguous). Tieteellisestä vilpistä kiinnostuneille tutkijoille artikkelien poisvetäminen on tietysti vain yksi mittari tieteellisen vilpin määrästä. Kuten Retraction Watch -blogin tekstiä kommentoinut e-Patient Dave toteaa, lisäyksessä ei liene niinkään kyse lisäyksestä tehtyjen rikosten (actual crime) määrässä vaan enemmänkin kyse on raportoitujen rikosten (reported crime) määrästä.

Kirjoitin tänne blogiin vuoden 2010 toukokuussa ajatuksiani tiedeartikkelien "poisvetämisestä" jutussa Martin Stone - jatko-osa ja muistan ihmetelleeni sitä, miten artikkelin saattaminen pois ihmisten luettavista ylipäätään on mahdollista. Pyydetänkö tilaajia ja kirjastoja repimään sivut pois tilaamastaan lehdestä? Sähköisestä julkaisusta artikkeli lähtee tietysti delete-nappia painamalla - tai näin luulisi tapahtuvan "virallisen" poisvetämisilmoituksen yhteydessä. Retraction Watch -blogissa tuodaan vielä esille Steenin yllättävä havainto tieteellisten lehtien epäjohdonmukaisesta toiminnasta. Steenin mukaan lehdet eivät riittävästi varoita naivia lukijaa: 31.8% noista 742 artikelista napotttaa edelleen lehtien sivuilla ikäänkuin niiden sisältämä tieto olisi asianmukaista tai asianmukaisesti tuotettua eikä "retractionia" olisi tapahtunutkaan.

Mietin myös, että onkohan suomalaisista tiedelehdistä vedetty koskaan pois yhtään artikkelia? Tai onko Suomessa peruttu jo myönnettyä tutkintoa sen perusteella, että opinnäytetyö, gradu, lisensiaatintyö tai väitöskirja paljastuu jälkikäteen plagiaatiksi tai muuten vilpilliseksi? Itse asiassa tässä retraction -tekstissä Plagiointitutkijalta loppuivat suomen kielen sanat kesken: Onko meillä edes käytössä sanoja ja käsitteitä tällaiseen vilpin käsittelyyn. Otetaan pois? Vedetään takaisin? Perutaan? Poistetaan?

Yliopistolaissa todetaan, että "opiskelijaa, joka on syyllistynyt yliopiston opetus- tai tutkimustoimintaan kohdistuvaan rikkomukseen (...) voidaan kurinpidollisesti rangaista rikkomuksen vakavuudesta riippuen varoituksella tai erottamalla määräajaksi, enintään yhdeksi vuodeksi".
- Entä jos tieteellinen vilppi todetaan sen jälkeen, kun tutkinto on jo myönnetty?
- Ja mitä kaikkea nuo "opetus- tai tutkimustoimintaan kohdistuvat rikkomukset" ovat?

13.1.2011

Vielä muutama sana plagiaatintunnistimista

Viime viikolla kirjoitin tänne blogiin Saksassa tehdyistä testeistä, joilla Debora Weber-Wulffin johdolla tutkittiin plagiaatintunnistimien toimivuutta (Miten hyvin sähköiset plagiaatintunnistimet toimivat?)

Jonathan Bailey kirjoittaa tänään blogissaan asiasta otsikolla PlagAware Takes Top Honors in Plagiarism Checker Showdown. Bailey pitää Weber-Wulffin tekemiä testejä ja tutkimuslinjaa arvokkaana kansainvälisestikin, erityisesti kun tunnistimiin syötettiin eri kielillä kirjoitettuja tekstejä (saksa, englanti, japani). Tulokset noudattavat pitkälle Baileyn itsensä tekemiä testauksia, havaintoja ja kannanottoja, ja tässäkin kirjoituksessa hän ottaa reilusti kantaa. Hän on samaa mieltä testauksessa esille tulleista seikoista: jotkut plagiaatintunnistimet eivät toimi ollenkaan. Bailey uskaltaa myös sanoa ääneen, että jotkut plagiaatintunnistuspalveluja myyvät tai niitä ilmaiseksi tarjoavat firmat itse asiassa keräävät materiaalia, jota myyvät sitten hyväuskoisille opiskelijoille "paperitehtaista" (paper mills) tilattuina esseinä ja opinnäytetöinä. Plagiaatintunnistuspalvelu onkin itse asiassa plagiaattien myyntipalvelu! Jos olet vahingossa laittanut tekstisi johonkin tällaiseen palveluun, voi olla että tekstisi ilmestyy jossain muualla jonkun muun nimellä. Bailey on myös nimennyt näitä huijausjärjestelmiä tekstissään.

Bailey muistuttaa, että plagiaatintunnistimia (niitä oikeita) käytetään kahdessa tarkoituksessa: 1) tarkistetaan onko jokin teksti alkuperäinen tai 2) tarkistetaan onko jossain julkaistu aiemmin julkaistua tekstiä. Nyt käsitellyt Softwaretest2010 analyysit oli siis tehty korkeakoulujen näkökulmasta, jolloin tunnistimen avulla pyritään selvittämään, onko kirjoittaja itse luonut oman, uuden tekstin. Sisällöntuottajien näkökulmasta plagiaatintunnistimia käytetään todentamaan sitä, onko vaikkapa minun tekstiäni tai osia minun tekstistäni käytetty sellaisenaan jossain muualla.

8.1.2011

Miten hyvin sähköiset plagiaatintunnistimet toimivat?

Debora Weber-Wulff on jatkanut sähköisten plagiaatintunnistusohjelmien testausta ja hän on julkaissut tulokset vuonna 2010 testaamiensa plagiaatintunnistimien toimivuudesta. Tulokset ovat luettavissa täältä: Softwaretest 2010. Weber-Wulffin johtama tutkimusryhmä testasi 27 plagiaatintunnistusohjelmaa nykyisin käytössä olevista 46 ohjelmasta. Testauksen päätulos on, että plagiaatintunnistimet eivät toimi kovin hyvin!

Softwaretest 2010 toteutettiin niin, että kuhunkin testattavaan plagiaatintunnistusohjelmaan syötettiin juuri tätä testausta varten laadittuja keinotekoisia plagiaatteja, testitekstejä. Tekstit eivät siis olleet kenenkään julkaisemia tekstejä, artikkeleita tai opintosuorituksia. Testauksessa selvitettiin, miten hyvin ohjelma tunnistaa tiedetyn plagiaatin.

Mikään plagiaatintunnistusohjelma ei päässyt Weber-Wulffin ryhmän tekemissä testauksissa hyvään tai erinomaiseen tulokseen. Parhaimmat tunnistimet huomasivat tekstien samankaltaisuden vähän vajaassa 70%:ssa tapauksia. Testatuista plagiaatintunnistimista viisi ylsi luokkaan "osittain hyödylliset" tunnistimet, ne tunnistivat 60-70% internetistä kopioiduista teksteistä.

Plagiaatintunnistimia on testattu vuodesta 2004 lähtien. Mielenkiintoista Weber-Wulffin julkaisemissa tuloksissa on se, että vuonna 2008 sähköiset plagiaatintunnistimet selvisivät tehtävästään paremminkuin vuonna 2010. Nyt ohjelmat tunnistavat entistä huonommin muunnettua sanajärjestystä, sanojen korvaamista synonyymeillä tai joidenkin sanojen poisjättämistä/joidenkin sanojen lisäämistä plagioituun tekstiin.

Viittasin aiemmassa blogikirjoituksessani (10.2.2010) Jonathan Baileyn tekemiin havaintoihin plagiaatintunnistimien toimivuudesta. Kirjoituksessaan 5 Reasons Google is My Primary Plagiarism Checker Bailey perustelee näkemystään siitä, miksi Google toimii hyvin myös plagiaatintunnistimena: se on halpa, nopea, tarkka, yksinkertainen käyttää. Mahdollisen plagioinnin toteaa aina ihminen, eikä minkään ohjelman antama raportti voi olla päätöksen ainoa perustelu. Googlen käyttöä plagiointia tunnistettaessa rajoittaa se, että monet tieteellisten aikakauslehtien julkaisutietokannat ovat suljettuja ja niihin Google ei päässe. Toisaalta Suomessa Google toimii plagiaatin toteamisessa mainiosti, meillähän julkaistaan paljon erilaisia opinnäytetöitä ja väitöskirjoja sähköisesti, ja Google löytää hyvin tekstien samankaltaisuudet. Googlen käyttöä tässä tarkoituksessa voi harjoitella kirjoittamalla hakuun jonkun yleisesti käytetyn lauseen ja katsoa, kuinka monta osumaa tai samankaltaisuutta tulee. Sitten voikin katsoa, että mihin lauseessa on viitattu vai onko kyseessä tekijän oma ajattelu (=ei ole viitattu mihinkään).

- - - "Tieto on hyvin perusteltu tosi uskomus" (Lähde: Wikipedia)- - -

1.1.2011

Tekstien duplikaatio ja kloonaus tiedelehdissä

Nature -lehti linkittää nettiartikkeleidensa oikeaan sivupalkkiin aiempia lehdessä ilmestyneitä aihepiiriin kuuluvia artikkeleita. Silmiini osui vuonna 2008 ilmestynyt, Declan Butlerin kirjoittama artikkeli (Nature 455, 715) Entire-paper plagiarism caught by software. Lyhyesti: ranskalainen biogerontologi Eric Le Bourg luki korealaista tieteellistä lehteä, jossa huomasi oman aiemmin julkaistun artikkelinsa ilmestyneen uudelleen, tällä kertaa jonkun toisen "kirjoittamana". Kun Le Bourg yritti selvittää asiaa, hänen tai alkuperäisen artikkelin julkaisseen lehden (Experimental Gerontology) yhteydenottoihin ei vastattu. Le Bourgin tekstin plagiaatin julkaisseen lehden (Korean Journal of Biological Sciences) ilmestyminen on sittemmin päättynyt.

Butler haastatteli tähän artikkeliinsa Harold Garneria, joka on selvittänyt erityisesti lääketieteen alan artikkeleiden päällekkäisjulkaisemista yhdessä Mounir Erramin kanssa. Errami ja Garner lähtivät selvittämään tekstien duplikaatiota: miten paljon samatekstisiä artikkeleita ylipäätään hyväksytään julkaistavaksi ja julkaistaan alkuperäisinä tiedeartikkeleina. He tutkivat asiaa vertaamalla Medline -tietokannassa olevia tekstejä samankaltaisuuksien löytämiseksi. He käyttivät eTBLAST -hakukonetta ja vertailivat aluksi 62000 artikkelia. Tutkimuksen alustavat tulokset on julkaistu Mounir Erramin ja Harold Garnerin yhdessä kirjoittamassa artikkelissa A tale of two citations (Nature 451, 397-399). Tutkitun 62000 artikkelin joukosta löytyi 421 potentiaalista duplikaattia, joita tutkijat alkoivat tarkastella manuaalisesti. He päätyivät toteamaan, että 0,04% Medlinen julkaisuista on plagiaatteja, ja 1,35% on saman kirjoittajan/kirjoittajien eri lehdissä julkaisemia tekstejä. Kun Medlinessa oli vuonna 2008 yhteensä 8,7 miljoonaa tekstiä, tämä tulos tarkoittaa sitä että joukossa on arvioitu olevan 117 500 ainakin kaksi kertaa samojen kirjoittajien julkaisemaa tekstiä ja 3500 plagiaattia. Tästä 62000 tekstin aineistosta tutkijat löysivät 73 plagiaattia, joista he ovat olleet yhteydessä kirjoittajiin ja julkaisijoihin.

Kirjoittajat pohtivat tieteellisen julkaisemisen eettisyyttä ja sitä, miksi tutkijoiden moraali näyttää löystyneen sähköisen julkaisemisen aikakaudella. Useimmat tiedelehdet pyytävät julkaisun tarjoajalta sitoumuksen siitä, että artikkelia ei ole tarjottu mihinkään toiseen lehteen. Kaikki tieteilijät eivät tätä asiaa ota vakavasti: kun Errami ja Garner tutkivat kaksoisjulkaistujen artikkeleiden päivämääriä, he joutuivat toteamaan että useat (ainakin) kaksi kertaa julkaistuista artikkeleista oli lähetetty eri lehtiin samanaikaisesti. Duplikaatit saattoivat ilmestyä jopa saman kuukauden aikana, vaikka tieteellisten lehtien referee-käytäntö kestää tyypillisesti useita kuukausia. Kirjoittajat tuovat esille myös käsitteen 'serial offender', jonka voisi tässä yhteydessä kääntää vaikkapa sarjaplagioijaksi - tutkimuksen aikana paljastui useita tutkijoita, joilta löytyi useampi kuin yksi julkaistu plagiaatti. Sen sijaan refereet (artikkelin ulkopuoliset arvioijat) paljastuivat luultua harvemmin plagioijiksi. Näin sitkeät huhut siitä, että refereet viivyttävät arviointiaan tarkoituksellisesti, jotta ehtisivät itse julkaista tekstin ensin, tulivat kumotuiksi.

Tieteellisten artikkeleiden julkaisemisella kahteen (duplikaatio) tai useampaan kertaan (kloonaus) saattaa olla ikäviä seurauksia. Etenkin lääketieteen alalla tarvittaisiin useita alkuperäistutkimuksia vaikkapa jonkin hoidon tai lääkeaineen tehokkuuden toteamiseksi. Errami ja Garner toteavat, että tässä alkuperäisten tulosten julkaisemisessa useaan kertaan ei ole pelkästään kyse moraalittomista omaa etuaan tavoittelevista tutkijoista, vaan samojen tutkimustulosten julkaisu voi luoda lääkäreille ja potilaille väärän kuvan tutkimustuloksen yleistettävyydestä ja hyödyllisyydestä.