Verktygen för databehandling och visning i forskning är olika och beror starkt på typen av data, forskningsfrågan och forskarens skicklighet. Här är en uppdelning kategoriserad efter funktion:
i. Databehandlingsverktyg:
* Programmeringsspråk: Dessa ger mest flexibilitet och kontroll.
* r: Ett kraftfullt open source-språk specifikt utformat för statistisk datoranvändning och grafik. Utmärkt för statistisk analys, datamanipulation och visualisering.
* python: Ett mångsidigt språk med många bibliotek (som pandor, numpy, scikit-learn) för datamanipulation, analys, maskininlärning och mer. Bra för stora datasätt och komplexa analyser.
* Matlab: Ett äganderätt starkt inom numerisk beräkning, särskilt användbar för tekniska och vetenskapliga tillämpningar.
* SAS: Ett egen statistiskt programvarupaket som används i branscher och forskning för avancerad statistisk analys.
* stata: Ett statistiskt programvarupaket populärt inom samhällsvetenskap och epidemiologi.
* kalkylblad (t.ex. Microsoft Excel, Google Sheets, LibreOffice Calc): Lämplig för mindre datasätt och enklare analyser. Användbart för datastrengöring, grundläggande beräkningar och skapa enkla diagram. Begränsningar uppstår emellertid med större datasätt eller komplexa analyser.
* Statistiska programvarupaket:
* SPSS: Ett egen statistiskt programvarupaket känt för sitt användarvänliga gränssnitt, vanligtvis används inom samhällsvetenskap.
* jmp: En proprietär statistisk upptäcktsprogramvara som kombinerar interaktiva visualiseringar med statistisk modellering.
* databashanteringssystem (DBMS): För att hantera och fråga stora datasätt.
* sql (strukturerat frågespråk): Används för att interagera med relationella databaser som MySQL, PostgreSQL och Oracle.
* NoSQL -databaser (t.ex. MongoDB, Cassandra): Hantera icke-relationella datastrukturer effektivt.
ii. Datavvisning och visualiseringsverktyg:
* Programmeringsspråk (R &Python): Båda erbjuder kraftfulla visualiseringsbibliotek (GGPLOT2 i R, MATPLOTLIB, SEABORN, PLOTLY i Python) för att skapa siffror för publiceringskvalitet.
* kalkylbladsprogramvara: Inbyggda kartläggningsfunktioner för grundläggande visualiseringar (bardiagram, cirkeldiagram, linjediagram).
* Specialiserad visualiseringsprogramvara:
* Tableau: Ett kraftfullt affärsintelligensverktyg för att skapa interaktiva instrumentpaneler och visualiseringar.
* Power Bi: Microsofts Business Analytics -tjänst som erbjuder liknande funktioner som Tableau.
* qgis: Open Source Geographic Information System (GIS) -programvara för visualisering av geospatialdata.
iii. Andra viktiga verktyg:
* versionskontroll (t.ex. Git): Avgörande för att hantera och spåra ändringar av kod och data, särskilt i samarbetsprojekt.
* Cloud Computing -plattformar (t.ex. AWS, Google Cloud, Azure): Erbjud skalbara datorresurser för hantering av stora datasätt och komplexa analyser.
Att välja rätt verktyg beror på:
* dataset storlek och typ: Små datasätt kan hanteras i kalkylblad, medan stora, komplexa datasätt kräver programmeringsspråk och databaser.
* Forskningsfråga: De statistiska testerna och visualiseringarna som behövs kommer att påverka valet av programvara.
* forskarens färdigheter och erfarenhet: Bekanta med specifika programvarupaket kan vara en avgörande faktor.
* Budget: Vissa programvarupaket är egna och kräver licenser, medan andra är öppen källkod och gratis.
Denna lista är inte uttömmande, men den täcker många vanligt använda verktyg. Det bästa tillvägagångssättet är ofta att kombinera flera verktyg för att utnyttja deras styrkor. Till exempel kan du använda en databas för datahantering, R för statistisk analys och ett visualiseringsverktyg som Tableau för att skapa påverkande siffror för ett forskningsdokument.