RapidMiner-distributionen inkluderer en generisk forbindelse, der gør det muligt at konstruere datasæt fra enhver database, som en ODBC-driver er tilgængelig for. Konnektoren kaldes JDBC-ODBC Bridge og er en integreret del af Java 1.7 og tidligere. Konsekvenserne af det er:
- Version 1.8 og nyere versioner af Java inkluderer ikke den oprindelige JDBC-ODBC Bridge.
- Den oprindelige bro er inkluderet i en kerne Java Archive-fil, den kan ikke adskilles fra den Java-distribution, den fulgte med.
Hvis du skal forbinde RapidMiner til en 32-bit ODBC-driver, skal du bruge Easysoft JDBC-ODBC Bridge i stedet. Easysoft JDBC-ODBC Bridge har en Java-komponent og en 32-bit native-komponent. Det er fuldt understøttet af Easysoft og er i øjeblikket ved at blive implementeret i produktionsmiljøer over hele verden.
Du skal bruge den professionelle version af RapidMiner for at bruge tredjepartsdrivere såsom Easysoft JDBC-ODBC Bridge med den. En prøveversion af RapidMiner Professional er tilgængelig for brugere, der opretter en konto på RapidMiner-webstedet.
Hvis du ikke allerede har RapidMiner Professional, skal du følge disse trin:
- Opret en RapidMiner-konto, og bekræft derefter den e-mailadresse, du angav, da du oprettede kontoen.
- Download RapidMiner Studio til din Windows-platform.
- Start RapidMiner, og log derefter ind, når du bliver bedt om det.
Din RapidMiner Professional-prøveperiode er nu startet.
Sådan forbinder du RapidMiner til nogle ODBC-data:
- Konfigurer en system-ODBC-datakilde for den database, du vil oprette forbindelse til i RapidMiner.
For at gøre dette skal du bruge 32-bit versionen af ODBC Data Source Administrator på din RapidMiner-maskine. På nogle versioner af Windows er dette placeret i Kontrolpanel> Administrative værktøjer . På nogle versioner af Windows skal du søge efter ODBC i proceslinjens søgefelt. 32-bit versionen af ODBC Data Source Administrator skal være tydeligt mærket. Hvis du er i tvivl, skal du skrive:
i dialogboksen Kør i Windows%windir%\syswow64\odbcad32.exe
Vi ønskede at prøve RapidMiner med nogle Microsoft Access-data, og derfor oprettede vi en Access ODBC-driverdatakilde, der pegede på Northwind-databasen.
- Download Easysoft JDBC-ODBC Bridge. (Registrering påkrævet.)
- Installer og licenser Easysoft JDBC-ODBC Bridge på den maskine, hvor RapidMiner er installeret.
For installationsinstruktioner, se Easysoft JDBC-ODBC Bridge-dokumentationen.
- I RapidMiner skal du vælge Forbindelser> Administrer databasedrivere .
Administrer databasedrivere dialogboksen vises.
- Vælg Tilføj .
- Udfyld dialogboksens felter:
Felt Værdi Navn Easysoft JDBC-ODBC Bridge URL-præfiks jdbc:easysoft:// Port (Lad det være tomt) Skemaseparator (Lad det være tomt) Jar-fil easysoft_install_dir \Jars\EJOB.jar På 64-bit Windows er standardplaceringen for
:\Program Files (x86)\Easysoft Limited\Easysoft JDBC-ODBC Bridge. På 32-bit Windows er standardplaceringen for
:\Program Files\Easysoft Limited\Easysoft JDBC-ODBC Bridge. JDBC-klasse easysoft.sql.jobDriver - Vælg Gem .
- Vælg Forbindelser> Administrer databaseforbindelser .
Administrer databaseforbindelser dialogboksen vises.
- Vælg Ny .
- Udfyld dialogboksens felter:
Felt Værdi Navn JDBC-ODBC Bridge Databasesystem Easysoft JDBC-ODBC Bridge Vært localhost/ Port (Lad det være tomt) Dabase-skema my_odbc_data_source - Vælg Avanceret
Avancerede forbindelsesegenskaber dialogboksen vises.
- Udfyld dialogboksens felter:
Felt Værdi logonuser my_windows_user logonpassword my_windows_password Vælg Tilsidesæt for begge disse felter.
- Brug Test knappen for at bekræfte, at du har indtastet forbindelsesoplysningerne korrekt.
For at analysere ODBC-data, der er gjort tilgængelige via JDBC-ODBC Bridge, skal du oprette en ny RapidMiner-proces:
- Vælg Fil> Ny proces .
- Vælg en tom proces, når du bliver bedt om det.
- Brug Repository rude for at finde ODBC-dataene. Vi brugte JDBC-ODBC Bridge til at afsløre nogle Access-data i Northwind-databasen:DB> JDBC-ODBC Bridge> Eksempelsæt> Kunder .
- I Design visning skal du trække en tabel fra Repository ruden til Process rude. I vores tilfælde var bordet Kunder .
- Træk en Blending> Værdier> Indstil data operatør fra Operatorer ruden til Process rude.
- Træk output fra henteoperatøren til Indstil data operatør.
- Brug Indstil data fanen parameter for at ændre en kolonneværdi. For eksempel har vi ændret en stillingsbetegnelse i vores kundedata fra Sælger til Salgschef :
Felt Værdi Eksempelindeks 1 Attributnavn Kunde-id Værdi ALFKI Yderligere værdier Rediger liste (0) ...> attributnavn KontaktTitel Rediger liste (0) ...> værdi Salgschef
- Træk output fra Indstil data operatør til res-knappen og vælg Afspil .
De ændrede data vises i Resultater se.