English version

INFOS11 Johdanto tiedonhakututkimukseen 5 op (3 ov)

Korvaava kirjatentti

Kirjatentti korvaa luennot ja seminaarin.

Opintojakson tavoite

Opiskelija saa yleisnäkemyksen tiedonhakututkimuksen keskeisistä suuntauksista ja oppii lukemaan ja arvioimaan kriittisesti alan tutkimuskirjallisuutta.

Suoritus

Aineistokohdat 1 ja 2 ovat kaikille yhteisiä, kohdasta 3 valitaan kaksi ryhmää. Tutustu ohjeisiin niin osaat keskittyä lukemisessa olennaisiin kokonaisuuksiin. Kohtien 2 ja 3 artikkelit ovat saatavissa kokoteksteinä ja tulostettavissa Tampereen yliopiston verkossa olevilla tietokoneilla.

Aineistot

1) Ingwersen, P. & Järvelin, K. The Turn: Integration of Information Seeking and Retrieval in Context. Springer/Kluwer 2005. Luetaan  luvut 1-5 s. 1-258. Ks. myös Definitions s. 381-392.

Lukuvihjeet

luettelomerkki Kirjassa kuvataan tiedonhaku- ja tiedonhankintatutkimuksen eri osa-alueita ja koulukuntia. Tärkeä punainen lanka on tiedonhakijan/inhimillisen toimijan roolin huomiointi ja kehitys erilaisissa tutkimustraditioissa ja niitä edustavissa teoreettisissa viitekehyksissä.
luettelomerkki Kirjan teoreettisena lähtökohtana oleva kognitiivinen näkökulma (cognitive view) kuvataan luvussa 2.
luettelomerkki Luku 3 käsittelee tiedonhankintatutkimusta ja on jatkon kannalta tärkeä antamalla tiedonhakututkimukselle mielekkään toiminnallisen kontekstin (tiedonhankinnan mallit - 3.1.2), esittelemällä tärkeitä peruskäsitteitä (mm. työ- ja hakutehtävät - 3.1.3) sekä luonnehtimalla alan tutkimuksessa sovellettuja tutkimusmenetelmiä.
luettelomerkki Luvussa 4 esitellään järjestelmäsuuntautunutta tiedonhakututkimusta ja sen viitekehyksenä toimivaa hakujärjestelmien evaluointimallia (alaluku 4.1). Tutkimussuuntauksen kannalta keskeisten käsitteiden tulkinnat annetaan alaluvussa 4.3. Alaluvut 4.4 - 4.8 esittelevät eräitä tiedonhakututkimuksen osa-alueita, joista on hyvä hankkia yleisen tason käsitys. Järjestelmäsuuntautuneen tiedonhakututkimuksen ymmärtämisen kannalta on tärkeää lukea huolella tutkimusmenetelmiä käsittelevä alaluku 4.9 sekä tutkimussuuntaukseen liittyviä rajoituksia käsittelevä alaluku 4.11.
luettelomerkki Luvussa 5 ovat tärkeimpiä johdanto-osa, vuorovaikutteisen tiedonhaun eri osa-alueet lyhyesti esittelevät alaluvut 5.3-5.6, relevanssin käsitteeseen pureutuva 5.7 sekä tutkimusmenetelmiä käsittelevä 5.8.
luettelomerkki Pyri luetun pohjalta hahmottamaan eri tutkimussuuntausten tapa (ja tapoihin liittyviä eroja) (a) mallintaa tiedonhakuilmiöitä, (b) määritellä ja operationalisoida peruskäsitteitä sekä (c) valita käytetyt tutkimusmenetelmät.  

2) Yhteiset artikkelit

  1. Voorhees, Ellen & Harman, Donna (2000). Overview of the Sixth Text REtrieval Conference (TREC-6). Information Processing & Management 36(1) 1-204.  ja

  2. Borlund, Pia (2003). The IIR evaluation model: a framework for evaluation of interactive information retrieval systems. Information Research, 8(3), paper no. 152 .

 

Lukuvihjeet

luettelomerkki Voorhees ja Harman kuvailevat laboratoriosuuntautuneen tiedonhakututkimuksen kansainvälisen yhteistyöfoorumin (TREC) toimintaa ja kuinka tutkimusta sen puitteissa tehdään. Olennaista on hahmottaa mm. TRECin tavoitteet ja historia, hakutehtävistä ad hoc task, testikokoelman komponentit, relevanssiarvioinnin periaatteet sekä evaluoinnin suoritus. Pelkästään reititystehtäviin (routing task) liittyvät asiat voi sivuuttaa. Erityistutkimuksen linjat (tracks) voi lukea kursoorisesti niin että ymmärtää minkä tyyppisestä tiedonhausta niissä on kyse.
luettelomerkki Borlund esittelee kehittämäänsä käyttäjäsuuntautunutta vuorovaikutteisen tiedonhaun evaluointimallia. Mallin kehittämisen taustalla on TREC:ssä omaksuttuun ns. Cranfieldin paradigmaan kohdistunut kritiikki tutkimusasetelman keinotekoisuudesta ja käyttäjän huomiotta jättämisestä. Artikkelia lukiessa kannattaa kiinnittää huomiota siihen, mitä Borlund pitää ongelmallisena laboratoriomallin tutkimuksessa ja mitä olennaisia osia hän muuttaa tutkimusasetelmassa. Tuloksellisuusmittariosuudet (RR measure, RHL indicator, jne) voi lukea hieman kevyemmin: yleiset periaatteet ja erot mittarien välillä tulee ymmärtää mutta kaavoja ei tarvitse hallita.
luettelomerkki Kannattaa vertailla artikkelien antamaa kuvaa tiedonhakujärjestelmien laboratoriosuuntautuneesta tutkimuksesta "The Turn" -kirjaan (mm. luvut 1.2-1.4, 4.9-4.11).

3) Valinnaiset artikkeliryhmät (valitaan 2)

Lukuvihjeet

Artikkelit kunkin ryhmän sisällä on pyritty valitsemaan niin, että ne muodostavat yhden teemallisen kokonaisuuden mutta edustavat kuitenkin erilaisia näkemyksiä tai lähestymistapoja. Lukiessa kannattaa kiinnittää huomiota mitä nuo erot artikkelien välillä ovat.

Ryhmä I: "Operationaalisten hakujärjestelmien evaluoinnin klassikot"

  1. Blair D.C. & Maron M.E. (1985). An evaluation of retrieval effectiveness for a full-text document retrieval system. Communications of the ACM, 28(3)289-299.
  2. Salton G (1986) Another look at automatic text-retrieval systems. Communications of the ACM, 29(7):648-656. (kritiikkiä edelliseen).

  3. McKinin EJ, Sievert ME, Johnson ED and Mitchell JA (1991) The Medline Full-Text Project. Journal of the American Society for Information Science, 42(4):297-307.

Ryhmä II: ”Moniportainen relevanssiarviointi tiedonhakujärjestelmien evaluoinnissa”

  1. Sormunen, E. (2002). Liberal Relevance Criteria of TREC - Counting on Negligible Documents? In: Beaulieu, M. et al. (Eds): Proceedings of the Twenty-Fifth Annual ACM SIGIR Conference on Research and Development in Information Retrieval. August 11-15, 2002, Tampere, Finland. Special Issue of SIGIR Forum 36():324-330. 
  2. Kekäläinen, J. & Järvelin, K. (2002). Using Graded Relevance Assessments in IR Evaluation. Journal of the American Society for Information Science and Technology 53(13): 1120-1129.
  3. Tang, R., Shaw, WM & Vevea, J.L. (1999). Towards the identification of the optimal number of relevance categories. Journal of the American Society for Information Science 50(3):254-264. 

Ryhmä III: ”Tiedonhaku ja oppiminen”

  1. Halttunen, K. (2003). Scaffolding performance in IR instruction : exploring learning experiences and performance in two learning environments. Journal of Information Science 29(2003):5, 375-390.
  2. Halttunen, K. & Järvelin, K. (2005). Assessing learning outcomes in two information retrieval learning environments. Information Processing & Management 41(2005):4, 949-972.
  3. Pharo, N. & Järvelin, K. (2006). "Irrational" searchers and IR-rational researchers. Journal of the American Society for Information Science and Technology 57(2):222-232.

Ryhmä IV: "Kuvatiedonhaun tutkimus"

  1. Markkula M. and Sormunen E. (2000). End-User searching challenges indexing practices in the digital photograph archive. Information Retrieval 1(4): 259-285.
  2. Sormunen E., Markkula M. and Järvelin K. (1999). The Perceived Similarity of Photos - A Test-Collection Based Evaluation Framework for the Content-Based Image Retrieval Algorithms. In: Draper S. et al., eds. Mira 99: Evaluating interactive information retrieval. Electronic Workshops in Computing.
  3. Jörgensen, C & Jörgensen, P. (2005). Image querying by image professionals. Journal of the American Society for Information Science and Technology 56(12): 1346 - 1359.