Data mining søger efter skjulte, gyldige og alle mulige nyttige mønstre i store datasæt. Data Mining er en teknik, der hjælper dig med at opdage intetanende / uopdagede forhold mellem dataene for forretningsgevinster.
Der er mange nyttige værktøjer til rådighed til datamining. Følgende er en kurateret liste over Top 25 håndplukket Data Mining-software med populære funktioner og nyeste downloadlinks. Denne sammenligningsliste indeholder open source såvel som kommercielle værktøjer.
1) SAS Data mining:
Statistisk analysesystem er et produkt af SAS. Det blev udviklet til analyse og datastyring. Det tilbyder en grafisk brugergrænseflade til ikke tekniske brugere.
Funktioner:
- SAS Data mining-værktøjer hjælper dig med at analysere Big data
- Det er et ideelt værktøj til datamining, tekstminedrift og optimering.
- SAS tilbyder distribueret hukommelsesbehandlingsarkitektur, der er meget skalerbar
Download link: https://www.sas.com/en_us/insights/analytics/data-mining.html
2) Teradata:
Teradata er et massivt parallel åbent behandlingssystem til udvikling af store datalagerapplikationer. Teradata kan køre på Unix / Linux / Windows-serverplatform.
Funktioner:
- Teradata Optimizer kan håndtere op til 64 sammenkædninger i en forespørgsel.
- Tera-data har lave samlede ejeromkostninger. Det er let at opsætte, vedligeholde og administrere.
- Det understøtter SQL til at interagere med de data, der er gemt i tabeller. Det giver sin udvidelse.
- Det hjælper dig med at distribuere dataene til diskene automatisk uden manuel indgriben.
- Teradata leverer load & unload-værktøjer til at flytte data til / fra Teradata System.
Download link: https://www.teradata.in/Products/Cloud/IntelliCloud
3) R-programmering
R er et sprog til statistisk databehandling og grafik. Det bruges også til stor dataanalyse. Det giver en bred vifte af statistiske tests.
Funktioner:
- Effektiv datahåndterings- og lagringsfacilitet
- Det giver en række operatører til beregninger af arrays, især matricer,
- Det giver en sammenhængende, integreret samling af big data-værktøjer til dataanalyse
- Det giver grafiske faciliteter til dataanalyse, der vises enten på skærmen eller på hardcopy.
Download link; https://www.r-project.org/
4) STYRELSE
Board er et Management Intelligence Toolkit. Det kombinerer funktioner i business intelligence og corporate performance management. Det er designet til at levere business intelligence og business analytics i en enkelt pakke.
Funktioner:
- Giver dig mulighed for at analysere, simulere, planlægge og forudsige ved hjælp af en enkelt platform
- At oprette tilpassede analyse- og planlægningsapplikationer.
- Board All-In-One kombinerer BI, Corporate Performance Management og Business Analytics.
- Det giver virksomhederne mulighed for at udvikle og vedligeholde sofistikerede analyse- og planlægningsapplikationer.
- Den proprietære platform hjælper med at rapportere ved at få adgang til flere datakilder.
Download link: https://www.board.com/en
5) Dundas
Dundas er et virksomhedsklar værktøj til dataudvinding, der kan bruges til opbygning og visning af interaktive dashboards, rapporter osv. Du kan implementere Dundas BI som organisationens centrale dataportal.
Funktioner:
- Serverapplikation med fuld produktfunktionalitet
- Integrer og få adgang til alle slags datakilder
- Datavisualiseringer, der kan tilpasses
- Smart træk og slip-værktøjer
- Visualiser data gennem kort
- Forudsigende og avanceret dataanalyse
Download link: http://www.dundas.com/support/dundas-bi-free-trial
6) Inetsoft
Inetsofts Data mining-værktøjsstil Intelligence er nyttig data mining og intelligence platform. Det giver mulighed for hurtig og fleksibel transformation af data fra forskellige kilder.
Funktioner:
- Det hjælper dig med at få adgang til strukturerede og semistrukturerede kilder, lokale applikationer
- Giver dig mulighed for at optimere apps til dataforbrug og opdatering
- Tilbyde tilpassede og sikre niveauer af udforskning og rapportering af data.
- Skaler op for store datasæt af brugere ved hjælp af Inbuilt Spark-platformen
- Generer paginerede rapporter med indlejret forretningslogik og parametrering
Download link: https://www.inetsoft.com/products/StyleIntelligence/
7) H3O
H3O er et andet fremragende open source-software Data mining-værktøj. Det bruges til at udføre dataanalyse af dataene i cloud computing applikationssystemer.
Funktioner:
- H3O giver dig mulighed for at drage fordel af computerkraften i distribuerede systemer og in-memory computing
- Det giver hurtig og nem implementering i produktion med Java og binært format.
- Det hjælper dig med at bruge programmeringssprog som R,
- Python og andre til at bygge en model i H3O
- Distribueret behandling i hukommelsen
Download link: https://www.h3o.ai/
8) Qlik
Qlik er værktøj til dataudvinding og visualisering. Det tilbyder også dashboards og understøtter flere datakilder og filtyper.
Funktioner:
- Træk og slip grænseflader for at skabe fleksible, interaktive datavisualiseringer
- Svar med det samme på interaktioner og ændringer.
- Understøtter flere datakilder og filtyper
- Det giver nem sikkerhed for data og indhold på tværs af alle enheder.
- Det giver dig mulighed for at dele relevante analyser, herunder apps og historier, ved hjælp af et centraliseret hub.
Download link: https://www.qlik.com/us/products/qlik-sense
9) RapidMiner:
RapidMiner er et gratis data mining værktøj. Det bruges til dataklargøring, maskinlæring og implementering af modeller. Det tilbyder en række produkter til opbygning af nye data mining-processer og forudsigelig opsætningsanalyse.
Funktioner:
- Tillad flere datahåndteringsmetoder
- GUI eller batchbehandling
- Integreres med interne databaser
- Interaktive, delbare dashboards
- Prædiktiv analyse af Big Data
- Fjernanalysebehandling
- Datafiltrering, sammenføjning, fletning og aggregering
- Byg, træne og validere forudsigelige modeller
- Rapporter og udløste meddelelser
Downloadlink: https://my.rapidminer.com/nexus/account/index.html#downloads
10) Oracle BI
Oracle BI er en open source maskinindlæring og datavisualisering til nybegyndere og eksperter. Interaktive dataanalyser arbejdsgange med en stor værktøjskasse.
Funktioner:
- Interaktiv datavisualisering.
- Det tilbyder interaktiv udforskning af data til hurtig kvalitativ analyse med rene visualiseringer.
- Orange understøtter praktisk træning og visuelle illustrationer af koncepter fra datalogi.
- Det tilbyder et omfattende udvalg af tilføjelser til dataudvinding fra eksterne datakilder.
Download link: https://orange.biolab.si/
11) RIDDE
KNIME er open source-software til oprettelse af datavidenskabelige applikationer og tjenester. Dette dataudvindingsværktøj hjælper dig med at forstå data og til at designe datavidenskabelige arbejdsgange.
Funktioner:
- Hjælper dig med at oprette en ende på slutningen af datalogiske arbejdsgange
- Bland data fra enhver kilde
- Giver dig mulighed for at samle, sortere, filtrere og sammenføje data enten på din lokale maskine, i database eller i distribuerede big data-miljøer.
- Byg maskinindlæringsmodeller til klassificering, regression, dimensionreduktion
Download link: https://www.knime.com/software-overview
12) Tanagra
Tangra er et gratis brug af data mining værktøj til studier og forskningsformål. Det tilbyder forskellige dataminingmetoder fra statistisk læring, dataanalyse og maskinindlæring.
Funktioner:
- Tilbyder brugervenlig data mining software til forsker og studerende
- Det giver brugeren mulighed for at tilføje deres data mining metoder.
Download link: https://eric.univ-lyon2.fr/~ricco/tanagra/da/tanagra.html
13) Løser:
Solvers XLminer er let at bruge professionelt data mining-værktøj til datavisualisering, prognoser og data mining i Excel. Det tilbyder omfattende sæt dataforberedelsesfunktioner til at importere og rense dine data.
Funktioner:
- XLMiner tilbyder et omfattende sæt analysefunktioner baseret på både statistiske og maskinindlæringsmetoder.
- Værktøjet giver dig mulighed for at arbejde med store datasæt, der kan overskride grænserne i Excel.
- Det tilbyder indbyggede funktioner til udforskning og visualisering af data.
- Udforskning af data giver hurtig indsigt i skjulte forhold i dataene.
Download link: https://www.solver.com/xlminer-data-mining
14) Sisense
Sisense er et andet effektivt data mining-værktøj. Det analyserer og visualiserer øjeblikkeligt både store og forskellige datasæt. Det er et ideelt værktøj til at skabe dashboards med en bred vifte af visualiseringer.
Funktioner:
- Tillader at opbygge interaktive dashboards uden tekniske færdigheder
- Opret en enkelt version af sandheden med sømløse data
- Foren ikke-relaterede data til et centralt sted
- Øst træk-og-slip brugergrænseflade
- Giver adgang til dashboards selv på den mobile enhed
- Iøjnefaldende visualisering
- Identificerer kritiske metrics ved hjælp af filtrering og beregninger
- Håndterer data i stor skala på en enkelt råvareserver
Download link: https://www.sisense.com/
15) Data smeltning
DataMelt er et gratis værktøj til numerisk beregning, matematik, dataanalyse og datavisualisering. Dette program giver dig enkelheden i scripting-sprog, som Python, Ruby, Groovy med styrken af hundredvis af Java-pakker.
Funktioner:
- DataMelt tilbyder statistik, analyse af store datamængder og videnskabelig visualisering.
- Du kan bruge den med forskellige programmeringssprog på forskellige operativsystemer.
- Det giver dig mulighed for at oprette vektorgrafikbilleder i høj kvalitet (EPS, SVG, PDF osv.), Som kan inkluderes i LaTeX og en anden tekstbehandler.
- Data Melt tilbyder brugen af script-sprog, som er betydeligt hurtigere end den standard Python, der er implementeret i C.
Download link: https://jwork.org/dmelt/
16) ELKI:
ELKI er et open source data mining værktøj skrevet i Java. Værktøjet giver os mulighed for at undersøge algoritmer med vægt på ikke-overvågede metoder i klyngeanalyse og detektering af outlier.
Funktioner:
- ELKI tilbyder en omfattende samling af meget parametrerbare algoritmer
- Det giver nem og retfærdig evaluering og benchmarking af algoritmer.
- ELKI leverer dataindeksstrukturer såsom R * -træet, der forbedrer processen med datamining
Download link : https://elki-project.github.io/
17) SPMF
SPMF er et open source data mining bibliotek skrevet i Java. Det distribueres under GPL-licensen. Det giver dig mulighed for at integrere kildekode med anden Java-software.
Funktioner:
- Tillader tilknytning regel minedrift
- Understøtter sekventielt mønster og sekventiel regelminedrift
- Tilbyder minedrift med høje nytteværdier,
- Mineserie med tidsserier.
- Støt kompleks proces med klyngedannelse og klassificering
Download link: http://www.philippe-fournier-viger.com/spmf/
18) Alteryx
Alteryx er en Business Intelligence og analyseløsninger til virksomheden. Det er et specielt designet værktøj til dataanalytikere og forretningsledere.
Funktioner:
- Analytics til mellemstore virksomheder
- Det giver mulighed for ad hoc-analyse.
- Tilbyder hurtig online analytisk behandling
- Automatisk planlagt rapportering
- Meget tilpasselig Dashboard
Download link: https://www.alteryx.com/
19) Enterprise Miner
Enterprise Miner er en SAS-software, der tilbyder dig og banebrydende algoritmer designet til at hjælpe dig med at løse de mest betydningsfulde udfordringer og tilbyder de bedste løsninger til din virksomhed.
Funktioner:
- Hjælper dig med at forbedre forudsigelsesnøjagtigheden. Del pålidelige resultater
- Nem at bruge GUI og batchbehandling
- Avanceret forudsigende og beskrivende modellering
- Tilbyder automatisk scoring
- Automatiser modelimplementering og -scoring
Download link: https://www.sas.com/en_us/software/enterprise-miner.html
20) Datawatch
Datawatch Desktop er en datamining og business intelligence-løsning. Det giver dig mulighed for at fokusere på realtidsdatavisualisering. Det tilbyder værktøjer til at opbygge og implementere deres overvågnings- og analysesystemer uden behov for at skrive en enkelt kodelinje.
Funktioner:
- Træk-og-slip-funktion giver brugerne mulighed for at oprette en tilpasset visning af data
- Identificer handelsanomalier
- Analyser, hvordan alternative scenarier vil påvirke ydeevnen ved hjælp af historiske data
Download link: https://www.datawatch.com/in-action/panopticon-streaming-analytics-platform/
21) Avanceret minearbejder
En avanceret minearbejder er et nyttigt værktøj til databehandling, analyse og modellering. Dens brugervenlige arbejdsgangsgrænseflade giver dig mulighed for at udforske forskellige typer data.
Funktioner:
- Udpakning og lagring af data fra / til forskellige databasesystemer, filer og datatransformationer
- Tilbyder forskellige operationer på data, som prøveudtagning, sammenføjning af datasæt osv.
- Hjælper dig med at opbygge statistiske modeller, analyse af variabel betydning, klyngeanalyse osv.
- Nem og effektiv modellernes integration med eksterne it-applikationer
Download link: https://algolytics.com/products/advancedminer/
22) Analytisk løsning
Analytisk løsning er gratis at bruge peg-og-klik-værktøjet. Det giver dig mulighed for at foretage risikoanalyse og receptpligtig analyse i din browser. Det tilbyder fuld-power data mining job.
Funktioner:
- Hjælper dig med at indarbejde usikkerhed og løse med simuleringsoptimering, stokastisk programmering og robust optimering.
- Giver dig mulighed for at definere Monte Carlo-simuleringsmodellen ved hjælp af Excel-formler
Download link: https://analyticsolver.com/
23) PolyAnalyst
PolyAnalyst er dataudvindings- og analytisk værktøj til udvinding af handlingsbar viden skjult og faktisk struktureret af dataene.
Funktioner:
- Hjælper dig med at få adgang til data fra forskellige kilder og flette data fra forskellige kilder
- Du kan vælge fra et bredt udvalg af statistiske algoritmer og maskinlæringsalgoritmer.
- Tilbyder dig at oprette fyldningsrapport, som kan sammenfattes og kommunikere din indsigt
Download link: https://www.megaputer.com/polyanalyst/
24) Civis
Civis giver dig mulighed for at træffe informerede beslutninger med dataforsker og beslutningsmarked i tankerne. Det giver dit team mulighed for at samarbejde effektivt og finde løsninger hurtigere.
Funktioner:
- Tilbyder arkitektur, produkter og processer, der hjælper dig med at beskytte dine data
- Du kan konfigurere med et bibliotek med dataindtagelse og ETL-moduler.
- Skriv kode i et script, tilbyder flere scripts eller job i en workflow, og definer en workflow, der skal køre efter en tidsplan.
- Giver dig mulighed for at omdanne din analyse og modeller til applikationer, der kører på en fleksibel infrastruktur på produktionsniveau
Download link: https://www.civisanalytics.com/civis-platform/
25) Viscovery:
Viscovery er en workfloworienteret softwarepakke. Det er baseret på selvorganiserende kort og multivariate statistikker til udforskende datamining og forudsigelig modellering. Systemet udmærker sig i intuitiv brugervejledning, moden implementering.
Funktioner:
- En ideel projektmiljøplatform til målrettet drift
- Dedikerede arbejdsgange, der giver dig mulighed for at tilbyde fokuseret navigation
- Ryd trinene i arbejdsgangen med dokumenterede standardindstillinger
- Workflow-forgrening, der muliggør generering af modelvariationer
- Funktioner til integreret dokumentation og kommentar
- Flere håndteringsværktøjer for at lette brugen
Download link: https://www.viscovery.net/somine/