STAR

Mae STAR (Technolegau Semantig ar gyfer Adnoddau Archeolegol) yn brosiect a ariannwyd gan yr AHRC (2007-2010), mewn cydweithrediad â English Heritage, sy'n defnyddio technolegau sy'n seiliedig ar wybodaeth ac mewn semantig i'r parth archaeoleg ddigidol. Nod y prosiect yw datblygu dulliau newydd o gysylltu cronfeydd data archif digidol, geirfaoedd a'r llenyddiaeth lwyd gysylltiedig, gan fanteisio ar botensial ontoleg graidd, lefel uchel a thechnegau prosesu iaith naturiol.

  • Doug Tudhope, Prif Archwilydd
  • Ceri Binding, Cymrodyr Ymchwil
  • Andreas Vlachidis, Aelod o'r Prosiect
  • Renato Souza, Aelod o'r Prosiect
  • Keith May, Cydweithiwr y Prosiect o English Heritage.

Mae'r prosiect bellach wedi dod i ben ond mae ymchwil pellach yn parhau er mwyn adeiladu ar ganlyniadau STAR.

Allbynnau

Mae allbynnau STAR yn cynnwys arddangoswr ymchwil, gwasanaethau terminoleg semantig sy'n seiliedig ar SKOS a chymwysiadau eraill, ynghyd ag allbynnau data amrywiol, gan gynnwys cynrychioliadau RDF ac NLP yn mynegeio llenyddiaeth lwyd.

Mae astudiaeth achos gynnar ar STAR wedi cael ei chyhoeddi gan rwydwaith dulliau TGCh yr AHRC.

Cwestiynau a Phroblemau Ymchwil

Yn gynyddol o fewn archaeoleg, defnyddir y we i ledaenu setiau data. Mae hyn yn cyfrannu at y swm cynyddol o wybodaeth ar y 'we ddofn', y mae astudiaeth ddiweddar gan Bright Planet wedi amcangyfrif y byddai'n 500 gwaith yn fwy na'r 'we wyneb'. Fodd bynnag, nid oes gan Google a pheiriannau chwilio eraill y we yr offer i adalw gwybodaeth o'r cronfeydd data strwythuredig cyfoethog sy'n adnoddau allweddol ar gyfer ysgolheigion y dyniaethau. Mae canlyniadau ac adroddiadau archeolegol pwysig hefyd yn ymddangos fel llenyddiaeth lwyd, cyn neu yn lle cyhoeddiadau traddodiadol. Fel rheol, nid yw'r rhain yn cael eu mynegeio neu maent ar gael i'w chwilio ar wahân i ddogfennau gwe cyffredin. Mae'n anodd defnyddio peiriannau chwilio confensiynol i gysylltu'r rhain â setiau data neu yn wir i chwilio amdanynt gan ddefnyddio terminoleg heblaw'r hyn a ddefnyddir gan yr awduron.

Mae sefydliadau treftadaeth ddiwylliannol a chof yn gyffredinol yn ceisio amlygu cronfeydd data ac ystorfeydd o eitemau wedi'u digido, wedi'u cyfyngu'n flaenorol i arbenigwyr, i gynulleidfa academaidd a chyffredinol ehangach. Mae'r mapio o derminoleg leyg (neu faes pwnc cysylltiedig) i eirfaoedd technegol mewn parth penodol yn broblem argyfyngus. Mae angen offer i helpu ffurfio a mireinio chwiliadau a llywio drwy ofod gwybodaeth cysyniadau a ddefnyddir i ddisgrifio casgliad. Mae gwahanol bobl yn defnyddio gwahanol eiriau ar gyfer yr un cysyniad neu gallant ddefnyddio cysyniadau ychydig yn wahanol ac mae'r 'broblem geirfa' hon yn rhwystr i ehangu mynediad ysgolheigaidd.

Mae gan y sector draddodiad cyfoethog o gyflogi systemau trefniadaeth gwybodaeth (KOS - megis thesawrysau) i helpu i ryngweithredu'n semantig. Fodd bynnag, nid yw offer geirfa o'r fath yn aml wedi'u hintegreiddio'n llawn mewn systemau chwilio a mynegeio ac mae arferion ar-lein wedi tueddu i ddynwared amgylcheddau print traddodiadol. Nid yw potensial llawn yr adnoddau gwybodaeth hyn mewn amgylcheddau ar-lein wedi cael ei ymchwilio.

Mae ymchwil trawsbarth ysgolheigaidd yn aml yn cynnwys mynegiadau aml-gysyniad o'r cwestiwn ymchwil neu'r wybodaeth sydd ei hangen. Nid yw offer confensiynol yn hwyluso'r broses o gyffredinoli'r datganiad chwilio pan fydd angen chwilio'n drylwyr.

Nodau

Ymchwilio i botensial offer terminoleg semantig i ehangu a gwella mynediad at adnoddau archaeoleg ddigidol, gan gynnwys setiau data gwahanol a llenyddiaeth lwyd gysylltiedig.

Amcanion

  • Agor y llenyddiaeth lwyd i ymchwil ysgolheigaidd drwy ymchwilio i'r cyfuniad o ddulliau ieithyddol a KOS yn y parth archaeoleg digidol.
  • Datblygu dulliau newydd i wella cysylltiadau rhwng adnoddau cronfa ddata archifau digidol ac i lenyddiaeth lwyd gysylltiedig, gan fanteisio ar y potensial ontoleg graidd, lefel uchel.
  • Defnyddio technegau cyffredinoliad ymholiad aml-gysyniad i ymchwilio archaeoleg traws-barth.
  • Dylunio a gweithredu system chwilio arddangoswyr, mewn cydweithrediad â English Heritage.
  • Gwerthuso'r arddangoswr gyda golwg ar faterion cost/budd a chymhwyso'n ehangach yn y parth archaeolegol.
  • Ymgysylltu â'r gymuned archeolegol i lywio ymchwil a lledaenu canlyniadau.

Prif gyhoeddiadau'r prosiect


Connecting archaeological data and grey literature via semantic cross search (mynediad agored)

Vlachidis, A., Tudhope, D., Binding, C. a May, K. 1 Gorffennaf 2011. Internet Archaeology. 30


Negation detection and word sense disambiguation in digital archaeology reports for the purposes of semantic annotation (fersiwn derfynol)

Vlachidis, A. a Tudhope, D. 2015. Program-Electronic library and information systems. 49, 2, t. 118-134 17 t.


A knowledge-based approach to Information Extraction for semantic interoperability in the archaeology domain (fersiwn awduron)

Vlachidis, A. a Tudhope, D. 2016. Journal of the Association for Information Science and Technology. 67, 5, t. 1138-1152 15 t.