Ä,QWHJUDFMDWHFKQLNHNVSORUDFMLGDQ\FK]V\VWHPHP]DU]G]DQLDED]GDQ\FKQDSU]\NáDG]LH2UDFOHL'DWD0LQLQJ 37 Wprowadzenie (NVSORUDFMDGDQ\FK]ZDQDWDN*HRGNU\ZDQLHPZLHG]\ZED]DFKGDQ\FKdata mining, knowledge discovery in databaseswrsurfhvrgnu\zdqldqrz\fkqlh]qdq\fksr*\whf]q\fkl]ur]xpldá\fk Z]RUFyZ Z GX*\FK ZROXPHQDFK GDQ\FK: RVWDWQLFK ODWDFK REVHUZXMHP\ Z\UD(QH RGFKRG]HQLH RG GHG\NRZDQ\FK L Z\VSHFMDOL]RZDQ\FK V\VWHPyZ HNVSORUDF\MQ\FK L G*HQLH GR LQWHJUDFML W\FK V\VWHPyZ ] LVWQLHMF\PL V\VWHPDPL ]DU]G]DQLD ED]DPL GDQ\FK,QWHJUDFMD WD SU]HELHJD SU]HGH wszystkim w ramach magazynów danych (data warehouses NWyUH VWDQRZL GRVNRQDáH (UyGáR GDQ\FK GOD Uy*Q\FK WHFKQLN HNVSORUDF\MQ\FK 3RF]ZV]\ RG ZHUVML VHUZHUD ED]\ GDQ\FK 2UDFOH RIHUXMH QRZ\ PRGXá XPR*OLZLDMF\ ádwzh ]DQXU]DQLH DSOLNDFML HNVSORUDF\MQ\FK EH]SRUHdnio w bazie danych. Wszystkie cz\qqrfl FKDUDNWHU\VW\F]QH GOD HNVSORUDFML WDNLH MDN EXGRZDQLH L WHVWRZDQLH PRGHOL RGNU\ZDQLH UHJXá DVRFMDF\MQ\FK EG( NODV\ILNDFMD GDQ\FK V GRVWSQH]DSoPRF]ELRUXNODVLIXQNFMLM]\ND-DYD,QWHUIHMVSURJUDPRZ\PRGXáX2UDFOHi Data Mining pozwala prrjudplvwrp QD SHáQ NRQWURO QDG SURFHVHP HNVSORUDFML GDQ\FK L FDáNRZLW LQWHJUDFMWHJRSURFHVX]LVWQLHMFDUFKLWHNWXUED]\GDQ\FK Architektura Oracle9i 'DWD 0LQLQJ VNáDGD VL ] GZyFK NRPSRQHQWyZ LQWHUIHMVX programistycznego (Oracle9i Data Mining API, ODM API) i serwera eksploracyjnego (Data 0LQLQJ 6HUYHU '06 2'0 $3, MHVW ]ELRUHP NODV L IXQNFML ]D SRPRF NWyU\FK SURJUDPLVWD RNUHOD ]ELyU GDQ\FK Z NWóU\FK EG]LH SU]HELHJDü HNVSORUDFMD Z\ELHUD RGSRZLHGQLPHWRG XVWDOD ZDUWRFL SDUDPHWUyZ VWHUXMFych przebiegiem poszczególnych algorytmów, itp. DMS jest NRPSRQHQWHP]DV]\W\PZED]LHGDQ\FK-HVWWR]ELyUSURFHGXU3/64/LIXQNFMLM]\ND-DYDNWyUH GRNRQXMHNVSORUDFML3R]DW\P'06]DZLHUDUHSR]\WRULXPZNWyU\PSU]HFKRZ\ZDQHVPRGHOH eksploracji i jej wyniki. Oracle9i'DWD0LQLQJXPR*OLZLDGZDWU\E\HNVSORUDFMLXF]HQLH]QDG]RUHPsupervised learning) i uczenie bez nadzoru (unsupervised learning). Do uczenia z nadzorem wykorzystywana jest metoda klasyfikacji. Algorytm wykorzystywany do klasyfikacji to implementacja naiwnego klasyfikatora Bayes a (Naive Bayes). Poza budowaniem (applying) klasyfikatora Oracle9i Data Mining po]zdod UyZQLH* QD DSOLNRZDQLH PRGHOX GR GDQ\FK scoring), testowanie modelu na danych treningowych (testing) oraz stosowanie modelu do nowych danych w celu obliczenia Uy*Q\FK ZDUWRFL VWDW\VW\F]Q\FK computing lift 0HWRG Z\NRU]\VW\ZDQ GR XF]HQLD QLH nadzorowanego jest odkrywanie asocjacji. Oracle9i Data Mining wykorzystuje w tym celu algorytm o nazwie Association Rules. Algorytm ten pozwala na odkrywanie i przechowywanie UHJXáZUHSR]\WRULXPVHUZHUDHNsSORUDF\MQHJRZFHOXLFKSy(QLHMV]HMDQDOL]\ 0HWRG\HNVSORUDFMLGRVWSQHZ2UDFOHi Data Mining.ODV\ILNDFMD]DSRPRFQDLZQHJRNODV\ILNDWRUD%D\HV D Naiwny klasyfikator Bayes a jhvw MHGQ ] PHWRG XF]HQLD PDV]\QRZHJR VWRVRZDQ GR UR]ZL]\Zania problemu sortowania i klasyfikowania. Zadaniem klasyfikatora Bayes a jest SU]\SRU]GNRZanie nowego przypadku do jednej z klas decyzyjnych, przy czym zbiór klas GHF\]\MQ\FKPXVLE\üVNRF]RQ\L]GHILQLRZDQ\DSULRUL'RSU]\SLVDQLDSU]\SDGNXGRRNUHORQHM klasy klasyfikator wykorzystuje twierdzenie Bayes a. 7ZLHUG]HQLD %D\HV D PyZL *H GOD GZyFK QLH]DOH*Q\FK ]GDU]H $ L % SUDZGRSRGRELHVWZR wystslhqld%mholz\vwslár$z\qrvl P(B A) = (P(B) * P(A B)) / P(A) = P(A i B) / P(A), JG]LH3$R]QDF]DSUDZGRSRGRELHVWZR*HZ\VWSL$3$_%R]QDF]DSUDZGRSRGRELHVWZR*H Z\VWSL$SRGZDUXQNLHP*HZ\VWSLáRMX*%]D3$L%R]QDF]DSUDZGRSRGRELHVWZRWHJR*H Z\VWSL ]DUyZQR $ MDN L % -DN ZLGDü QDLZQ\ NODV\ILNDWRU %D\HV D ]DNáDGD QLH]DOH*QRü przynádgyz : SU]\SDGNX JG\ SRV]F]HJyOQH SU]\NáDG\ V ]DOH*QH NODV\ILNDWRU GRNRQXMH
38 0LNRáDM0RU]\0DUHN:RMFLHFKRZVNL V]DFRZDQLDSUDZG]LZHMZDUWRFL(NVSHU\PHQW\GRZRG]MHGQDN*HV]DFRZDQLHQLHZSá\ZDVLOQLH QD]GROQRüNODV\ILNDWRUDdo poprawnego przewidywania..odv\ilndwru PR*H E\ü Z\NRU]\VW\ZDQ\ GR NODV\ILNDFML ELQDUQHM L ZLHORNODVRZHM'OD SU]\NáDGX PRGHONODV\ILNDFMLELQDUQHM]RVWDá]EXGRZDQ\QDSRGVWDZLHLQIRUPDFMLRNUHG\WDFK]DFLJQLW\FK SU]H]NOLHQWyZEDQNXRUD]RFLJDOQRFLW\FKNUHG\WyZ.D*G\NOLHQW]RVWDáSU]\SLVDQ\GRMHGQHM ]GZyFKNODVµEH]SLHF]Q\ NOLHQFL]WHMNODV\VSáDFLOLNUHG\W\ZWHUPLQLHLµU\]\NRZQ\ NOLHQFL] WHMNODV\RFLJDOLVL]HVSáDWNUHG\WX1DSRGVWDZLHWDN]EXGRZDQHJRPRGHOXNODV\ILNDWRUPR*e RNUHODü NDV GR NWyUHM QDOH*\ QRZ\ NOLHQW XELHJDMF\ VL R NUHG\W 2SUyF] RNUHOHQLD NODV\ klasyilndwrurnuhodwh*sudzgrsrgrelhvwzrsrsudzqrflnodv\ilndfmlqsqrz\nolhqwqdoh*\gr NODV\µU\]\NRZQ\ ]SUDZGRSRGRELHVWZHP Naiwny klasyfikator %D\HV D MHVW MHGQ ] QDMEDUG]LHM HIHNW\ZQ\FK PHWRG XF]HQLD PDV]\QRZHJR VáX*F GR NODV\ILNDFML GRNXPHQWyZ WHNVWRZ\FK : SUDNW\FH VWRVRZDQ\ MHVW QDMF]FLHM GR filtrozdqld GRNXPHQWyZ QS Z SU]HV]XNLZDUNDFK LQWHUQHWRZ\FK.D*G\ GRNXPHQW Z ]ELRU]H treningoz\p MHVW SU]\SLVDQ\ GR MHGQHM ] NODV QS UR]U\ZND QDXND SROLW\ND = ND*G\P GRNXPHQWHP]ZL]DQ\MHVWZHNWRU]DZLHUDMF\OLF]EZ\VWSLHVáyZ]SUHGHILQLRZDQHMOLVW\VáyZ WDNDOLVWD]D]Z\F]DM]DZLHUD NLONDVHWOXENLONDW\VLF\VáyZ.ODV\ILNDWRU]EXGRwany na takim zbiorze daq\fk ZHMFLRZ\FK SRWUDIL ] EDUG]R GX* WUDIQRFL SU]\SLV\ZDü QRZH GRNXPHQW\ GR LVWQLHMF\FKNODV 5HJXá\DVRFMDF\MQH 5HJXá\ DVRFMDF\MQH VáX* GR UHSUH]HQWRZDQLD ZVSyáZ\VWSRZDQLD HOHPHQWyZ 1DMF]FLHM UHJXá\ DVRFMDF\MQHVZ\NRU]ystywane w analizie koszyka zakupów (market basket analysis), w trakcie NWyUHM RGNU\ZDQH VIDNW\ZVSyáZ\VWSRZDQLD SRV]F]HJyOQ\FK WRZDUyZ OXE JUXS WRZDUyZ Z zanxsdfk NOLHQWyZ 3U]\NáDGHP UHJXá\ DVRFMDF\MQHM PR*H E\ü QS UHJXáD Ä NOLHQWyZ NWyU]\ kupili V]DPSDQD NXSLáR WH* NDZLRU =DNXS V]DPSDQD L NDZLRUX Z\VWSLá Z ZV]\VWNLFK ]DNXSyZ 5HJXá\ DVRFMDF\MQH RGNU\WH Z ED]LH GDQ\FK RSLVXMFHM ]DNXS\ PRJ E\ü wykorzystywane do orjdql]rzdqld SURPRFML SRF]WRZ\FK RIHUW VSU]HGD*\ NRQVWUXRZDQLD transakcji wi]dq\fksodqozdqldndwdorjyzoxesodqrzdqldur]nádgxwrzduyzlsyáhnzvnohslh 'UXJLPZD*Q\PVHJPHQWHPZ\NRU]\VWDQLDUHJXáDVRFMDF\MQ\FKMHVWDXWRPDW\F]QDSHUVRQDOL]DFMD VHUZLVyZLQWHUQHWRZ\FK5HJXáDNWyUDJáRVLÄX*\WNRZQLNyZNWyU]\REHMU]HOLVWURQ A a po QLHMVWURQ%ZQDVWSQHMNROHMQRFLREHMU]HOLVWURQ& PR*HE\üZ\NRU]\VWDQDGRDXWRPDW\F]QHM PRG\ILNDFML VWURQ\ SUH]HQWRZDQHM X*\WNRZQLNRZL L GRGDZDQLD VNUyWyZ GR VWURQ NWyUH prawdopogreqlh LQWHUHVXM GDQHJR X*\WNRZQLND : SU]\SDGNX WHFKQRORJLL LQWHUQHWRZ\FK UHJXá\ DVRFMDF\MQH V Z\NRU]\VW\ZDQH SU]HGH ZV]\VWNLP GR GRGDZDQLD UHNRPHQGDFML ]DNXSyZ L G\QDPLF]QHM]PLDQ\VWUXNWXU\SRáF]HPLG]\SoV]F]HJyOQ\PLF]FLDPLVHUZLVX )RUPDOQLH UHJXá\ DVRFMDF\MQH PR*QD ]GHILQLRZDü Z RSDUFLX R SRMFLH ]ELRUX F]VWHJR 1LHFK L={l 1, l 2,...,l n`eg]lh]elruhpolwhudáyz]zdq\fkhohphqwdpl1lhfk'eg]lhnrohnfmwudqvdnfml JG]LH ND*GD WUDQVDNFMD MHVW GRZROQHM GáXJRFL L T D T / 0yZLP\ *H WUDQVDNFMD 7 ZVSLHUD HOHPHQW [ MHOL [ 7 0yZLP\ *H WUDQVDNFMD 7 ZVSLHUD ]ELyU ; MHOL 7 ZVSLHUD ND*G\ HOHPHQW x X. Wsparciem (support ]ELRUX ; QD]\ZDP\ VWRVXQHN OLF]E\ WUDQVDNFML ZVSLHUDMF\FK ; GR liczby wszystkich transakcji. support( X, D) = { T D : T wspiera X} D 3UREOHPRGNU\ZDQLD]ELRUyZF]VW\FKSROHJDQD]QDOH]LHQLXZGDQHMED]ie danych D wszystkich ]ELRUyZ NWyU\FK ZVSDUFLH MHVW Z\*V]H RG ]GHILQLRZDQHM SU]H] X*\WNRZQLND ZDUWRFL ]ZDQHM minimalnym wsparciem (minsup =ELyU NWyUHJR ZVSDUFLH MHVW Z\*V]H QL* PLQVXS QD]\ZDP\ zbiouhpf]vw\pfrequent itemset). 5HJXáDDVRFMDF\MQDWo implikacja postaci X Y, gdzie X L, Y L i X Y=. Zbiór X nazywamy JáRZ UHJXá\ D ]ELyU < FLDáHP UHJXá\ = ND*G UHJXá DVRFMDF\MQ ]ZL]DQH V GZLH PLDU\ wyznaf]dmfh VWDW\VW\F]QH ]QDF]HQLH L VLá UHJXá\ :VSDUFLHP support UHJXá\ ; Y w bazie
Ä,QWHJUDFMDWHFKQLNHNVSORUDFMLGDQ\FK]V\VWHPHP]DU]G]DQLDED]GDQ\FKQDSU]\NáDG]LH2UDFOHL'DWD0LQLQJ 39 danych D na]\zdp\ VWRVXQHN OLF]E\ WUDQVDNFML ZVSLHUDMF\FK UHJXá GR OLF]E\ ZV]\VWNLFK WUDQVDNFML,QQ\PLVáRZ\UHJXáD; <PDZED]LHGDQ\FK'ZVSDUFLHVMHOLVWUDQVDNFMLZED]LH danych wspiera X Y. support ( X Y, D) = { T D : T wspiera X Y} D 8IQRFL confidence UHJXá\ ; Y w bazie danych D nazywamy stosunek liczby transakcji wspieudmf\fkuhjxágrolf]e\wudqvdnfmlzvslhudmf\fkjárzuhjxá\,qq\plvárz\uhjxád; Y PDZED]LHGDQ\FK'XIQRüFMHOLFWUDQVDNFMLZVSLHUDMF\FK;ZVSLHUDUyZQLH*< confidence ( X Y, D) = { T D : T wspiera X Y} { T D : T wspiera X} WsparciHUHJXá\RNUHODMHM]QDF]HQLH]DXIQRüUHJXá\UHSUH]HQWXMHMHMVLá1DSU]\NáDGUHJXáD chleb ZRGD PLQHUDOQD PD Z\VRNLH ZVSDUFLH SRQLHZD* ]ELyU SURGXNWyZ ^FKOHE ZRGD mineralqd` MHVW EDUG]R SRZV]HFKQ\ ZUyG ]DNXSyZ NOLHQWyZ = GUXJLHM VWURQ\ UHJXáD ta ma QLHZLHON XIQRü SRQLHZD* ]DNXS FKOHED L ZRG\ PLQHUDOQHM QLH MHVW ]H VRE FLOH ]ZL]DQ\ 5HJXáDÄV]Dmpan NDZLRU PDEDUG]RZ\VRNXIQRüNOLHQWNXSXMF\EXWHONV]DPSDQDEDUG]R F]VWRNXSXMHWH*NDZLRUDOHQLVNLHZVSDUFLHSRQLHZD*QLHZLHOXNOLHQtów pozwala sobie na zakup tak luksusowych produktów. 3UREOHP RGNU\ZDQLD UHJXá DVRFMDF\MQ\FK SROHJD QD ]QDOH]LHQLX Z GDQHM ED]LH GDQ\FK ' wszystnlfk UHJXá DVRFMDF\MQ\FK NWyU\FK ZVSDUFLH L XIQRü V Z\*V]H RG ]GHILQLRZDQ\FK SU]H] X*\WNRwQLNDZDUWRFLPLQLPDOQHJRZVSDUFLDLPLQLPDOQHMXIQRFLminsup i minconf). Konstruowanie modelu eksploracji 8*\WNRZQLF\ NRU]\VWDMF\ ] 2UDFOHi 'DWD 0LQLQJ PRJ WZRU]\ü PRGHOH QD GZyFK SR]LRPDFK V]F]HJyáRZRFL QD SR]LRPLH IXQNFML L QD SR]LRPLH DOJRU\WPX %XGRZDQLH PRGHOX Qa poziomie IXQNFML SR]ZDOD QD SRPLQLFLH VSHF\ILNRZDQLD ZV]\VWNLFK V]F]HJyáyZ DOJRU\WPX L VNXSLHQLH VL QDZáDFLZ\PSU]HGPLRFLHHNVSORUDFML3RGF]DVEXGRZDQLDPRGHOXQDSR]LRPLHIXQNFML2UDFOHi Data Mining samodzielnie dobiera odpowiedni algorytm i wyznaf]d ZDUWRFL ZV]\VWNLFK paramewuyz G]LNL F]HPX ZLHOH WHFKQLF]Q\FK V]F]HJyáyZ ]ZL]DQ\FK ] HNVSORUDFM VWDMH VL QLHLVWRWQ\FKLQLHZLGRF]Q\FKGODX*\WNRZQLND8*\WNRZQLF\NWyU\PQLHZ\VWDUF]DMVWDQGDUGRZH SURFHGXU\ RGNU\ZDQLD Z]RUFyZ PRJ MHGQDN EXGRZDü model na poziomie algorytmu, GRVWRVRZXMF SURFHV HNVSORUDFML GRNáDGQLH GR VZRLFK SRWU]HE =EXGRZDQH PRGHOH V przechowywane w repozytorium serwera eksplorafmllprje\üsy(qlhmzlhornurwqlhx*\wh 3URFHV EXGRZDQLD PRGHOX VNáDGD VL ] NLONX QDVWSXMF\FK SR VRELH NURNyZ 1D SRF]WNX X*\tNRZQLN PXVL XWZRU]\ü GDQH ZHMFLRZH SRSU]H] VNRMDU]HQLH RELHNWX UHSUH]HQWXMFHJR GDQH (data mining object]u]hf]\zlvw\p(uygáhpgdq\fknwyu\ppr*he\üuhodfmdzed]lhgdq\fkoxe SáaVNL SOLN Z V\VWHPLH RSHUDF\MQ\P 1DVWSQLH X*\WNRZQLN WZRU]\ RELHNW UHSUH]HQWXMF\ ustawienia wybranej funkcji eksploracji (function settings object). W kolejnym kroku obiekt funkcji eksplorafmlmhvwzl]dq\]relhnwdpluhsuh]hqwxmf\plorjlf]qvwuxnwxugdq\fklogical data specification) i fizyczne wykorzystanie danych (data usage specification). W ostatnim kroku X*\WNRZQLN Z\NRQXMH Z\EUDQ SU]H] VLHELH PHWoG WZRU]HQLD PRGHOX NODV\ILNDFMD OXE odkrywanie asocjacji). =EXGRZDQ\ PRGHO NODV\ILNDF\MQ\ PR*H QDVWSQLH ]RVWDü SU]HWHVWRZDQ\ 7HVWRZDQLe pozwala na RV]DFRZDQLH GRNáDGQRFL NODV\ILNDFML 3RGF]DV WHVWRZDQLD PRGHO NODV\ILNDWRUD MHVW VWRVRZDQ\ GR ]ELRUX GDQ\FK WHVWRZ\FK NWyUH QLH E\á\ X*\WH GR EXGRZDQLD PRGHOX L GOD NWyU\FK ]QDQD MHVW warwrünodv\ilnrzdqhjrdwu\exwx:z\qlnxwhvwrzdqldx*\wnrzqlnrwu]\pxmhpdflhu]srp\áhn (confusion matrix ] NWyUHM PR*QD RGF]\WDü Z LOX SU]\SDGNDFK PRGHO SRSUDZQLH VNODV\ILNRZDá GDQH WHVWRZH D Z LOX VL SRP\OLá RUD] MDNLHJR W\SX E\á\ WR SRP\áNL $QDOL]D WDNLHM PDFLHU]\ po]zdod QD GRNáDGQLHMV]H GRVWURMHQLH PRGHOX D* GR X]\VNDQLD VDW\VIDNFMRQXMFHM MDNRFL
40 0LNRáDM0RU]\0DUHN:RMFLHFKRZVNL NODV\ILNDFML 'DQH Z\NRU]\VW\ZDQH GR WHVWRZDQLD PXV] RGSRZLDGDü VSHF\ILNDFML ORJLF]QHM struktury danych wykorzystywanych do budowania modelu. Model klasyfikatora zastosowany do nowych danych powoduje obliczhqlhsu]hzlg\zdqhmzduwrfl OXE NODV\ ZUD] ] SUDZGRSRGRELHVWZHP 'DQH GR NWyU\FK VWRVRZDQ\ MHVW PRGHO PXV] odpowiagdü VSHF\ILNDFML VWUXNWXU\ ORJLF]QHM GDQ\FK Z\NRU]\VW\ZDQ\FK GR EXGRZDQLD PRGHOX :\QLN]DVWRVRZDQLD NODV\ILNDWRUD MHVW QDMF]FLHM]DSLV\ZDQ\ GR ED]\ GDQ\FK 0RGHO PR*H E\ü stosowaq\ GR ]ELRUX UHNRUGyZ RGF]\WDQ\FK ] WDEHOL (UyGáRZHM DOER GR SRMHG\QF]HJR UHNRUGX (reprezentowanego wówczas przez pojedynczy obiekt). Przed zapisaniem do bazy danych wynik NODV\ILNDFMLPR*H]RVWDüSU]HWZRU]RQ\GRSRVWDFLRGSRZLDGDMFHMX*\WNRZQLNRZL'ODSU]\NáDGX X*\WNRZQLN PR*H GRNRQDü NODV\ILNDFML NOLHQWyZ Z\OLF]DMF SUDZGRSRGRELHVWZR SU]\QDOH*QRFL ND*GHJR NOLHQWD GR MHGQHM ] NODV µgreu\ µuhgql µ]á\ L ]DSLVDü GR UHODFML Z\QLNRZHM W\ONR identyfikatory klientów wraz z identyfikatorem przewidywanej klasy i wyliczonym SUDZGRSRGRELHVWZHP Dla binarnych modeli klasyfikacji (modeli, w których przewidywany atrybut przyjmuje tylko dwie ZDUWRFLSR]\W\ZQLQHJDW\ZQ2UDFOHi Data Mining pozwala na wyliczanie przhvxqlfldlift). 7HVWRZDQHUHNRUG\VVRUWRZDQH]JRGQLH]SUDZGRSRGRELHVWZHPSRSUDZQRFLNODV\ILNDFMLZWHQ VSRVyE *H SR]\W\ZQH SU]\NáDG\ NODV\ILNRZDQHM NODV\ FKDUDNWHU\]XMFH VL QDMZ\*V]\P prawdosrgrelhvwzhp UHNRUG\ GOD NWyU\FK NODV\ILNDWRU MHVW QDMEDUG]LHM SHZQ\ SRSUDZQRFL LFK sklasyfinrzdqld MDNR SR]\W\ZQ\FK SU]\NáDGyZ V XPLHV]F]DQH QD SRF]WNX ]D QDMEDUG]LHM prawdopogreqlhqhjdw\zqhsu]\nádg\nodv\vxplhv]f]dqhqdnrfx7dnsrvruwrzdqhuhnrug\ V QDVWpQLH G]LHORQH QD NZDQW\OH 'OD ND*GHJR kwantyla Oracle9i Data Mining wylicza QDVWSXMFHVWDWystyki: JVWRüNZDQW\ODtarget density): stosunek liczby pozytywnych rekordów w kwantylu do liczby wszystkich rekordów w tym kwantylu VNXPXORZDQDJVWRüNZDQW\ODcumulative target densityuhgqldjvwrüslhuzv]\fkq kwantyli SU]HVXQLFLH NZDQW\OD quantile lift VWRVXQHN JVWRFL NZDQW\OD GR JVWRFL ZV]\VWNLFK danych W przypadku stosowania modelu asocjacji Oracle9i Data Mining pozwala na zastosowanie stwou]rqhjr PRGHOX GR GDQ\FK (UyGáRZ\FK :\QLNLHP ]DVWRVRZDQLD PRGHOX MHVW ]ELyU UHJXá asocjaf\mq\fk RGNU\W\FK Z GDQ\FK (UyGáRZ\FK 2GNU\WH UHJXá\ PRJ E\ü Z\ZLHWORQH X*\WNRZQLNRZLRUD]]DSLVDQHGRUHSR]\WRULXPVHUZHUDHNVSORUDF\MQHJR5HJXá\VVNáDGRZDQHZ UHSR]\WRULXPZ]Z\Ná\FKUHODFMDFKG]LNLF]HPXPR*OLZHMHVWLFKRGF]\WDQLHL]DSUH]HQWRZDQLH ]DSRPRFGoZROQ\FKQDU]G]LDQDOLW\F]Q\FKQS2UDFOH'iscoverer, Oracle Reports)..ODV\RELHNWyZWZRU]FHVHUZHUHNVSORUDFML 3RQL*HMSU]HGVWDZLRQRRSLV\QDMZD*QLHMV]\FKNODVZFKRG]F\FKZVNáDG2UDFOH9i'DWD0LQLQJ6 WR NODV\ XPR*OLZLDMFH SURJUDPLVWRP WZRU]HQLH DSOLNDFML ED]RGDQRZ\FK Z\NRU]\VWXMF\FK techniki eksploracji danych. Fizyczna specyfikacja danych Fizyczna specyfikacja danych (physical data specification WR RELHNW UHSUH]HQWXMF\ IL]\F]Q VWUXNWXU GDQ\FK Z\NRU]\VW\ZDQ\FK Z HNVSORUDFML 6SHF\ILNDFMD RNUHOD PLG]\ LQQ\PL IRUPDW GDQ\FKQD]Z\DWU\EXWyZUROHSHáQLRQHSU]H]SRV]F]HJyOQHDWU\EXW\'DQHUHSUH]HQWRZDQHSU]H] IL]\F]QD VSHF\ILNDFM PRJ E\ü Z\NRU]\VWDQH Z Uy*Q\FK HWDSDFK HNVSORUDcji, np. podczas budozdqld PRGHOX MHJR WHVWRZDQLD REOLF]DQLD SU]HVXQLFLD OXE SRGF]DV DQDOL]\ VWDW\VW\F]QHM Oracle9i'DWD0LQLQJDNFHSWXMHGDQHZHMFLRZHZGZyFKIRUPDWDFK WUDQVDNF\MQ\ ND*G\ SU]\NáDG MHVW SU]HFKRZ\ZDQ\ Z ED]LH GDQ\FK Z SRVWDFL ZLHOX rekordów w tabeli o schemacie SEQUENCEID, ATTRIBUTE_NAME, VALUE. SEQUENCEID WROLF]EDFDáNRZLWDNWyUDVáX*\GRLGHQW\ILNRZDQLDUHNRUGyZRSLVXMF\FK WHQ VDP SU]\NáDG ATTRIBUTE_NAME WR ádfxfk ]QDNyZ SU]HFKRZXMF\ QD]Z
Ä,QWHJUDFMDWHFKQLNHNVSORUDFMLGDQ\FK]V\VWHPHP]DU]G]DQLDED]GDQ\FKQDSU]\NáDG]LH2UDFOHL'DWD0LQLQJ 41 atrybutu a VALUE WR OLF]ED FDáNRZLWD UHSUH]HQWXMFD ZDUWRü GDQHJR DWU\EXWX : przypadku atryexwyz R GX*HM OLF]ELH Uy*Q\FK ZDUWRFL 2UDFOHi Data Mining XGRVWSQLDPHWRG\XPR*OLZLDMFHG\VNUHW\]DFMWDNLFKDWU\EXWyZ NDWHJRU\F]Q\ND*G\SU]\NáDGMHVWSU]HFKRZ\ZDQ\ZED]LHGDQ\FKZSRVWDFLMHGQego UHNRUGX 7DEHOD SU]HFKRZXMFD GDQH NDWHJRU\F]QH QLH PXVL SRVLDGDü RERZL]NRZR NOXF]D SRGVWDZRZHJR OHF] MHVW RQ ]DOHFDQ\ QS Z FHOX ádwzhjr ZL]DQLD UHNRUGyZ GDQ\FK ZHMFLRZ\FK ] UH]XOWDWDPL NODV\ILNDFML 2UDFOHi Data Mining wymaga aby dane kategoryc]qhe\á\g\vnuhw\]rzdqh : U]HF]\ZLVWRFL GDQH SU]HFKRZ\ZDQH Z IRUPDFLH NDWHJRU\F]Q\P V DXWRPDW\F]QLH konwertowane przez Oracle9i Data Mining do postaci transakcyjnej przed wykonaniem MDNLHJRNROZLHN DOJRU\WPX -HOL Z GDQ\FK Z\VWSXM ZDUWRFL SXVWH WR Z przypadku danych NDWHJRU\F]Q\FK SDUD DWU\EXW ZDUWRü! MHVW X*\ZDQD W\ONR ZWHG\ JG\ ZDUWRü MHVW QLHSXVWD: SU]\SDGNXGDQ\FKWUDQVDNF\MQ\FKMHOLNWyU\NROZLHN]DWU\EXWyZSEQUENCEID, ATTRIBUTE_NAME, VALUE MHVWSXVW\WRFDá\ZLHUV]MHVWSRPLMDQ\ Specyfikacja funkcji eksploracji Specyfikacja funkcji eksploracji (mining function specification WR RELHNW UHSUH]HQWXMF\ najbardziej ogólne parametry budowanego modelu. W obiekcie tym przechowywana jest informacja o typie wyniku danej funkcji, o specyfikacji logicznej struktury danych wykorzystywanych do budowania modelu, o specyfikacji wykorzystania danych i opcjonalnie o algorytmie wykorzystywaq\pgrexgrzdqldprghoxmholnrqnuhwq\dojru\wpqlh]rvwdqlhsrgdq\ to Oracle9i Data Mining samodzielnie wybiera odpowiedni algorytm). Specyfikacje funkcji HNVSORUDFMLVSU]HFKRZ\ZDQHZUHSR]\WRULXPVHUZHUDHNVSORUDFML Specyfikacja algorytmu eksploracji Specyfikacja algorytmu eksploracji (mining algorithm specification WR RELHNW SU]HFKRZXMF\ V]F]HJyá\ GRW\F]FH Z\NRU]\VW\ZDQHJR DOJRU\WPX 8*\FLH WHJR RELHNWX SR]ZDOD X*\WNRZQLNRP ]DDZDQVRZDQ\PQDGRNáDGQHGRVWRVRZDQLHHNVSORUDFMLGRVZRLFKSRWU]HELGRVWURMHQLHZV]\VWNLFK SDUDPHWUyZ DOJRU\WPX :\UD(Q\ UR]G]LDá PLG]\ VSHF\ILNDFM IXQNFML L DOJRU\WPX SR]ZDOD QD oddzlhohqlh X*\WNRZQLNyZ]DDZDQVRZDQ\FK RG X*\WNRZQLNyZ NRU]\VWDMF\FK]H VWDQGDUGRZ\FK procedur eksploracji. Specyfikacja struktury logicznej danych Specyfikacja struktury logicznej danych (logical data specification) to zbiór atrybutów eksploracyjnych opisumf\fk ORJLF]Q\ FKDUDNWHU GDQ\FK Z\NRU]\VW\ZDQ\FK SRGF]DV HNVSORUDFML.D*G\DWU\EXWHNVSORUDF\MQ\RSLVXMHGRPHQGDQ\FKZHMFLRZ\FK$WU\EXW\HNVSORUDF\MQHPRJ E\üNDWHJRU\F]QHEG(QXPHU\F]QH$NWXDOQLH2UDFOHi Data Mining wspiera wykorzystanie tylko i Z\áF]QLH DWU\EXWyZ NDWHJRU\F]Q\FK DWU\EXW\ QXPHU\F]QH PXV] E\ü G\VNUHW\]RZDQH GR SRVWDFL NDWHJRU\F]QHM.D*G\ DWU\EXW ZFKRG]F\ Z VNáDG VSHF\ILNDFML ORJLF]QHM PXVL SRVLDGDü XQLNDOQQD]Z6SHF\ILNDFMDORJLF]QDGDQ\FKMHVWWH*QD]\ZDQDV\JQDWXUPRGHOX. Specyfikacja fizycznego wykorzystania danych Specyfikacja fizycznego wykorzystania danych (data usage specificationwrrelhnwsu]hfkrzxmf\ LQIRUPDFMHRW\PZMDNLVSRVyEDWU\EXW\HNVSORUDF\MQHZFKRG]FHZVNáDGVSHF\ILNDFMLORJLF]QHM VZ\NRU]\VW\ZDQHZEXGRZDQLXPRGHOX.D*G\DWU\EXWPR*HE\ü nieaktywny (inactive DWU\EXW QLH MHVW Z\NRU]\VW\ZDQ\ WR GRP\OQH Z\NRU]\VWDQLH ka*dego atrybutu, aktywny (active): atrybut jest wykorzystywany do budowania modelu, dodatkowy (supplementary): atrybut jest wykorzystywany tylko jako dodatkowa informacja umieszczana razem z wynikami klasyfikacji.
42 0LNRáDM0RU]\0DUHN:RMFLHFKRZVNL 'RGDWNRZR GOD ND*GHJR DWU\EXWX VSHF\ILNDFMD IL]\F]QD SDPLWD F]\ GDQ\ DWU\EXW MHVW FHOHP klasyilndfmlf]\olf]\gdq\dwu\exwvwdqrzlnodvgrfhorznodv\ilndwrud Model eksploracji Model eksploracji (mining model WR RELHNW UHSUH]HQWXMF\ Z\QLN Z\NRQDQLD HNVSORUDFML SU]\ wynru]\vwdqlh RNUHORQ\FK XVWDZLH VSHF\ILNDFML IXQNFML HNVSORUDFML )L]\F]QD UHSUH]HQWDFMD moghox ]DOH*\ RG DOJRU\WPX Z\NRU]\VWDQHJR GR EXGRZDQLD modelu. Oracle9i Data Mining pozwala na przechowywanie modelu w repozytorium serwera eksploracji w postaci nazwanej encji. Wynik eksploracji Wynik eksploracji (mining resultssu]hfkrzxmhz\qlnz\nrqdqldmhgqhm]qdvwsxmf\fkrshudfml zastosowania modelx GR GDQ\FK SU]HWHVWRZDQLD PRGHOX QD GDQ\FK OXE REOLF]HQLD SU]HVXQLFLD Oracle9i Data Mining zezwala na zapisywanie wyników eksploracji jako nazwanych encji do repo]\wrulxp VHUZHUD HNVSORUDFML =PDWHULDOL]RZDQH Z\QLNL HNVSORUDFML PRJ E\ü QDVWSQLH wykorzyvwdqh GR DQDOL] SRUyZQD L UDSRUWyZ 2ELHNW WHQ SU]HFKRZXMH LQIRUPDFMH R QD]ZLH modelu wykou]\vwdqhjr Z HNVSORUDFML F]DV UR]SRF]FLD L ]DNRF]HQLD RSHUDFML QD]Z\ L lokalizacje danych wejflrz\fklz\mflrz\fk 0DFLHU]SRP\áHN 0DFLHU] SRP\áHN confusion matrix WR RELHNW SU]HFKRZXMF\ LQIRUPDFMH R GRNáDGQRFL klasyfikafml -HVW WR PDFLHU] NDWHJRU\F]QD Z NWyUHM ZLHUV]H L NROXPQ\ RGSRZLDGDM poszczególnym wartoflrp GDQHM NDWHJRULL D NRPyUNL PDFLHU]\ SU]HFKRZXM ZDUWRFL numeryczne. W macierzy pomyáhn ND*G\ ZLHUV] RGSRZLDGD U]HF]\ZLVW\P ZDUWRFLRP NODV\ILNRZDQHJR DWU\EXWX]D ND*GD NoOXPQD RGSRZLDGD ZDUWRFLRP Z\]QDF]RQ\P SU]H] PRGHO HNVSORUDFML 1D SU]HFLFLX ZLHUV]D L NoOXPQ\ XPLHV]F]RQD MHVW ZDUWRü RGSRZLDGDMFD OLF]ELH zaobserwowanych przypadków. Na przynádgolf]edxplhv]f]rqdqdsu]hflflxzlhuv]dägreu\ NOLHQW L NROXPQ\ Ä]á\ NOLHQW R]QDF]D *H NODV\ILNDWRU UD]\ QLHSRSUDZQLH ]DNODV\ILNRZDá GREUHJRNOLHQWDMDNRNOLHQWDQDOH*FHJRGRNDWHJRULLÄ]á\NOLHQW Wynik zastosowania eksploracji Wynik zastosowania eksploracji (mining apply output ]DZLHUD SHZQ OLF]E HOHPHQWyZ pozwalamf\fkqdvirupdwrzdqlhz\qlnyzhnvsorudfml:\qlnhnvsorudfmlpr*hsu]\mprzdüuy*qh postacie: GDQH VNDODUQH NWyUH V SU]HSLV\ZDQH EH]SRUHGQLR]GDQ\FKZHMFLRZ\FK GR danych wyjflrz\fkqszduwrfldwu\exwyznoxf]rz\fkoxedwu\exw\grgdwnrzh GDQH Z\OLF]RQH SU]H] DOJRU\WP QS QD]Z\ NODV SUDZGRSRGRELHVWZR SU]\QDOH*QRFL SU]\NáDGXGRNODV\ZDUWRüSU]HVXQLFLD GOD GDQ\FK Z IRUPDFLH WUDQVDNF\MQ\P ZDUWRü DWU\EXWX SEQUENCEID RSLVXMFHJR GDQ\ SU]\NáDG :\QLN ]DVWRVRZDQLD HNVSORUDFML SU]HGVWDZLDQ\ MHVW Z IRUPDFLH NDWHJRU\F]Q\P ND*GHPX przypadkowi wynikowemu odpowiada jeden rekord wynikowy. Dyskretyzacja Oracle9i Data Mining wymaga, aby dane wykorzystywane w algorytmach E\á\ G\VNUHW\]RZDQH '\VNUHW\]DFMD SR]ZDOD QD JUXSRZDQLH]ZL]DQ\FK]H VRE ZDUWRFL L SU]HWZDU]DQLH DWU\EXWyZ R ]QDF]QLH PQLHMV]HM OLF]ELH ZDUWRFL 3U]\NáDGRZR SRGF]DV G\VNUHW\]DFML ZDUWRFL ^FKOHE EXáND URJDOLNEDJLHWND`]RVWDá\E\SRáF]RQHZMHGQZDUWRü^SLHF]\ZR`'\VNUHW\]DFMDPR*HRGE\ZDü VLQDWU]\VSRVRE\
Ä,QWHJUDFMDWHFKQLNHNVSORUDFMLGDQ\FK]V\VWHPHP]DU]G]DQLDED]GDQ\FKQDSU]\NáDG]LH2UDFOHL'DWD0LQLQJ 43 G\VNUHW\]DFMDMDZQDGODDWU\EXWyZNDWHJRU\F]Q\FKX*\WNRZQLNSRGDMHUHJXá\PDSRZDQLD PLG]\]ELRUHPZDUWRFLL]UHGXNRZDQ\P]ELRUHPNDWHJRULLGODDWU\EXWyZQXPHU\F]Q\FK X*\WNRZQLNSRGDMHGROQHLJyUQHJUDQLFHGODND*GHMNDWHJRULL 1 QDMF]VWV]\FK W\ONR GOD DWU\EXWyZ NDWHJRU\F]Q\FK X*\WNRZQLN SRGDMH OLF]E n interevxmf\fk JR ZDUWRFL 2UDFOHi Data Mining automatycznie znajduje n QDMF]FLHM wystsxmf\fk ZDUWRFL D ZV]\VWNLH SR]RVWDáH V umieszczane w kategorii zbiorczej {others} SRG]LDá QD NZDQW\OH W\ONR GOD DWU\EXWyZ QXPHU\F]Q\FK X*\WNRZQLN SRGDMH OLF]E interevxmf\fkjrnzdqw\old2udfohi Data Mining automatycznie wyznacza dolne i górne warwrfldwu\exwyzgodnd*ghjr]nzdqw\ol Prz\NáDGRZ\SURJUDPZ\NRU]\VWXMF\2UDFOHi Data Mining 3RQL*HM ]DPLHV]F]RQR V]NLF SU]\NáDGRZHJR SURJUDPX Z\NRU]\VWXMFHJR PRGXá 2UDFOHi Data 0LQLQJ 3URJUDP RGNU\ZD UHJXá\ DVRFMDF\MQH Z UHODFML R VFKHPDFLH DEMO_TX(SEQ_ID,ATRYBUT,:$572û) SU]HFKRZXMFHM GDQH demograficzne o klientach banku. )UDJPHQWGDQ\FKZHMFLRZ\FK]RVWDáSU]HGVWDZLRQ\SRQL*HM 6(4B,'$75<%87:$572û ---------- ---------------------- ---------- 6000 wiek 4 SáHü 1 Z\NV]WDáFHQLH 6000 dochody 2 6000 zawód 23 6000 stan_cywilny 4 2GNU\FLH UHJXá DVRFMDF\MQ\FK Z WHM ED]LH GDQ\FK Z\PDJD Z\NRQDQLD NLONX NURNyZ 3RQL*HM przedvwdzlrqrsu]\nádgrzvhnzhqfmrshudfmlmdnlhpxv]]rvwdüz\nrqdqh 3RáF]HQLH]VHUZHUHPHNVSORUDFML 1D SRF]WNX SURJUDP X*\WNRZQLND PXVL QDZL]Dü SRáF]HQLH ] VHUZHUHP HNVSORUDF\MQ\P 'R SRáF]HQLDPR*QDZ\NRU]\VWDüGRwolny sterownik JDBC. Serwer eksploracji jest reprezentowany w programie przez obiekt klasy DataMiningServer]DSRáF]HQLH]VHUZHUHPMHVWUHSUH]HQWRZDQH przez obiekt klasy Connection. oracle.dmt.odm.dataminingserver dms = new oracle.dmt.odm.dataminingserver( jdbc:oracle:thin:@dcs-mm:1521:ora9i", "mikolaj", "*"); oracle.dmt.odm.connection dmsconnection = dms.login(); 8WZRU]HQLHIL]\F]QHMVSHF\ILNDFMLGDQ\FKGODGDQ\FKZHMFLRZ\FK 8*\WNRZQLNPDGRZ\ERUXGZDURG]DMHVSHF\ILNDFMLWUDQVDNF\MQDLNDWHJRU\F]QZ]DOH*QRFLRG formatu wykorzystywanych danych. oracle.dmt.odm.data.physicaldataspecification pds = new NonTransactionalDataSpecification(); Dokonanie dyskretyzacji danych '\VNUHW\]DFMD Z\PDJD SRGDQLD VSHF\ILNDFML GOD ND*GHJR DWU\EXWX L XWZRU]Hnia dwóch relacji tymf]dvrz\fk GR SU]HFKRZ\ZDQLD V]F]HJyáyZ R G\VNUHW\]DFML DWU\EXWyZ QXPHU\F]Q\FK L kategorycznych. Do dyskretyzowania danych numerycznych program wykorzystuje obiekty klasy NumericalDiscretization, NumericalBin, natomiast dyskretyzacja danych kategorycznych
44 0LNRáDM0RU]\0DUHN:RMFLHFKRZVNL wykorzystuje klasy CategoricalDiscretization i CategoryGroup'DQHRG\VNUHW\]DFMLVQDVWSQLH zapisywane do bazy danych do relacji tymczasowych. DiscretizationSpecification binningdetails[] = new DiscretizationSpecification[6]; // dyskretyzacja atrybutu WIEK NumericalBin bb0[] = new NumericalBin[6]; bb0[0] = new NumericalBin(1, (float)0.0, (float)18); bb0[1] = new NumericalBin(2, (float)18, (float)29); NumericalDiscretization bin0 = new NumericalDiscretization(bb0); DiscretizationSpecification des0 = new DiscretizationSpecification("wiek", bin0); binningdetails[0] = des0; // dyskretyzacja atrybutu dochód NumericalBin bb1[] = new NumericalBin[6]; bb1[0] = new NumericalBin(1, (float)0, (float)1000); bb1[1] = new NumericalBin(2, (float)1000, (float)1500); NumericalDiscretization bin1 = new NumericalDiscretization(bb1); DiscretizationSpecification des1 = new DiscretizationSpecification("dochód", bin1); binningdetails[1] = des1; LocationAccessData inputdatalocation = new LocationAccessData( demo_tx, mikolaj ); Transformation.createDiscretizationTables(dmsConnection, mikolaj, pds, binningdetails, num_temp, cat_temp, mikolaj ); LocationAccessData resultviewlocation = new LocationAccessData( decs_demo_tx, mikolaj ); Transformation.discretize(dmsConnection, mikolaj, pds, num_temp, cat_temp, mikolaj, mikolaj ); Zbudowanie specyfikacji funkcji eksploracji 8*\WNRZQLN WZRU]\ QRZ\ RELHNW UHSUH]HQWXMF\ VSHF\ILNDFM GDQ\FK ZHMFLRZ\FK MDNR LQVWDQFM klasy LogicalDataSpecification. Specyfikacja wykorzystania danych jest przechowywana w obiekcie klasy DataUsageSpecification :UHV]FLH XVWDZLHQLD IXQNFML V SU]HFKRZ\ZDQH Z Z\VWSLHQLX NODV\ AssociationRulesFunctionSettings (dla algorytmu klasyfikacji jest to klasa NaiveBayesSettings). LogicalDataSpecification lds = LogicalDataSpecification.create( "jdbc:oracle:thin:@dcs-mm:1521:ora9i", mikolaj, *, demo_tx, mikolaj, pds); DataUsageSpecification dus = DataUsageSpecification.create(lds.getMiningAttributes()); AssociationRulesFunctionSettings afs = new AssociationRulesFunctionSettings(0.01, 0, 2, lds, dus); afs.store(dmsconnection, Function_AR ); Zbudowanie modelu i odczytaniergnu\w\fkuhjxá Ostatnim krokiem wykonanym przez program jest pobranie wyników i ich zaprezentowanie X*\tNRZQLNRZL 'DQH PRJ E\ü ZF]\W\ZDQH GR RELHNWyZ NODV\ MiningRuleSet UHJXá\ asocjacyjne) lub ClassificationTestResult (klasyfikacja). LocationAccessData builddataaccessdata = new LocationAccessData( dics_demo_tx, mikolaj ); MiningModel.build(dmsConnection, builddataaccessdata, pds, afs, Model_AR ); ruleset = AssociationRulesModel.getRules(dmsConnection, Model_AR, (float) 0.01, 10); ruleset = AssociationRulesModel.getRulesBySupport(dmsConnection, Model_AR, (float) 0.50, 10);
Ä,QWHJUDFMDWHFKQLNHNVSORUDFMLGDQ\FK]V\VWHPHP]DU]G]DQLDED]GDQ\FKQDSU]\NáDG]LH2UDFOHL'DWD0LQLQJ 45 :HIHNFLHZ\NRQDQLDSRZ\*V]HJRSURJUDPXZUHSR]\WRULXPVHUZHUDHNVSORUDFML]RVWDM]DSLVDQH ]DUyZQR VSHF\ILNDFMD IXQNFML HNVSORUDFML MDN L PRGHO HNVSORUDFML L Z\QLN HNVSORUDFML 3RQL*HM przedstawiono fragmenty repozytorium. Tabela ODM_MINING_FUNCTION_SETTINGS przechowuje obiekty specyfikacji funkcji eksploracji. SQL> SELECT NAME, CREATION_TIMESTAMP, FUNCTION_NAME, ALGORITHM_NAME SQL> FROM ODM_MINING_FUNCTION_SETTINGS; NAME CREATION FUNCTION_NAME ALGORITHM_NAME -------------------- -------- -------------------- ------------------------------ Function AR 02/05/17 associationrules aprioriassociationrules Obiekty SUH]HQWXMFH PRGHO HNVSORUDFML V SU]HFKRZ\ZDQH Z UHSR]\WRULXP Z UHODFML 2'0B0,1,1*B02'(/'ODND*GHJRPRGHOX]DSLV\ZDQDMHVWMHJRQD]ZDPRPHQWUR]SRF]FLD EXGRZ\ PRGHOX PRPHQW ]DNRF]HQLD EXGRZ\ PRGHOX QD]ZD IXQNFML L X*\WHJR DOJRU\WPX lokalizacja dan\fkzhmflrz\fkrud]qd]z\uhodfmlz\qlnrz\fk SQL> SELECT NAME, STARTING_TIMESTAMP, ALGORITHM_NAME, DATA_LOCATION SQL> FROM ODM_MINING_MODEL; NAME STARTING ALGORITHM_NAME DATA_LOCATION -------------------- -------- ------------------------------ ------------------------------ Associations Model 02/05/17 aprioriassociationrules mikolaj.desc_demo_tx,qirupdfmh R RGNU\W\FK UHJXáDFK V]DSLV\ZDQH GR G\QDPLF]QLH WZRU]RQ\FK WDEHO-HGQD UHODFMD ]DZLHUD HOHPHQW\ QDOH*FH GR FLDáD UHJXá\ SRSU]HGQLND D GUXJD HOHPHQW\ JáRZ\ UHJXá\ QDVWSQiND3R]DVNáDGQLNDPLUHJXá\]DSDPLW\ZDQHVUyZQLH*ZDUWRFLSDUDPHWUyZZVSDUFLDL XIQRFLND*GHMUHJXá\ SQL> SELECT * FROM RT_0517021230148 WHERE RULE_ID = 1; RULE_ID ATTRIBUTE_NAME VALUE NUMBER_OF_ANTECEDENTS ---------- ------------------------------ ---------- --------------------- SUPPORT CONFIDENCE ANTECEDENT_SUPPORT CONSEQUENT_SUPPORT ---------- ---------- ------------------ ------------------ 1 zawód 14 1,000166694,001677852,099349892,000166694 SQL> SELECT * FROM AT_0517021230149 WHERE RULE_ID = 1; RULE_ID ATTRIBUTE_NAME VALUE ---------- ------------------------------ ---------- 1 dochód 4 1 wiek 3 1 stan_cywilny 2 Podsumowanie Oracle9i'DWD0LQLQJMHVW]JRGQ\]SRZVWDMF\PVtandardem o nazwie Java Data Mining. Standard WHQ MHVW GRSLHUR Z ID]LH WZRU]HQLD L REHMPXMH GRW\FKF]DVRZH SURSR]\FMH ]JáRV]RQH Z UDPDFK Common Warehouse Metadata (propozycja Object Management Group), Predictive Mining Markup Language (propozycja Data Mining Group) oraz SQL/MM for Data Mining (propozycja,62 %H] ZWSLHQLD MHVW WR FLHNDZD L RELHFXMFD SURSR]\FMD NWyUD Z QLHGDOHNLHM SU]\V]áRFL
46 0LNRáDM0RU]\0DUHN:RMFLHFKRZVNL XPR*OLZL MHV]F]H V]HUV]H Z\NRU]\VWDQLH WHFKQLN HNVSORUDFML GDQ\FK Z UDPDFK DSOLNDFML ED]RGDQRZ\FK Z V]F]HJyOQRFL LQWHJUDFM W\FK WHFKQLN ] PDJD]\QDPL GDQ\FK SRZVWDMF\PL Z oparciu o bazy danych Oracle.