Uttal på svenska av datamining {da´tamajning}.
A. Datautvinning (eng: data mining, datamining) består i att använda sådana metoder och verktyg som i gruvbrytning i ett berg. Syftet är att utvinna ny information genom att med datastyrda beräkningsformler få fram mönster i de databaser som man söker i, att sortera, välja ut och komplettera med information och i ett sista steg analysera fram huvudinnehållet i svåröverskådliga datamängder, KDD (Knowledge Discovery in Databases).
Det gör man med metoder för huvudkomponentreduktion: att ta fram de mest betydelsefulla mönstren utan att förlora väsentlig information. Det görs bland annat med en teknik som kallas PCA, princial component analysis, på svenska principalkomompentanalys.
Datautvinning kan i många sammanhang inte utföras med automatisk fungerande dataprogram. De som svarar för datautvinning och analys av erhållen information måste då ha vad man kallar domänexpertis (eng: domain expertise).
Med 'domän' avses här det kunskap- eller verksamhetsområde där de arbetar i sin datautvinning, sina analyser och sammanställningar. Genom att vara väl förtrogna med området, har de förvärvat en så stor mängd tyst kunskap att de kan styra utvinningen och även göra sina analyser till stor del intuitivt. Mer om detta finns i artiklar i detta lexikon om expertis, inre modell, mindlines, praktikerkunskap och tyst kunskap.
Data mining används i många sammanhang, bland annat i underrättelseverksamhet (spioneri), polisarbete . Det används i hälso- och sjukvården bland annat för att finna mönster i hälsofrämjande och hälsoskadligt beteende i befolkningen.
B. Textutvinning (eng: text data mining, text mining, textmining: Utvinning av information i vanlig text i tidskrifter, mail, reklam och så vidare. Det är fråga om utvinning av data och mönster av information i texter på vanligt språk, inte som i datamining i databaser med data ordnade i olika kategorier och kopplingar mellan dem.
Relaterade sökord: datafångst, grundad teori, induktion, informationssökning, mönsteranalys, p-hacking, textanalys, öppen vetenskap.
Etymologi för text and data mining: text, data + mining 'gruvbrytning'.
På svenska även: text- och datautvinning, dataextrahering,
information(ktivitet med verktyg för att söka efter mönster, samband och trender i
stora text- eller datamängder. Det engelska skrivsättet (data mining, text data mining och text mining) används i många framställningar även på svenska.
["grundad teori","induktion","mönsteranalys","p-hacking","öppen vetenskap","intuitivt","hälsofrämjande","informationssökning","expertis","inre modell","mindlines","praktikerkunskap","tyst kunskap","datafångst","textanalys"]