Poslovna Inteligencija

  • Uploaded by: seminarjoe
  • 0
  • 0
  • February 2021
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Poslovna Inteligencija as PDF for free.

More details

  • Words: 5,339
  • Pages: 20
Loading documents preview...
Tehniĉki fakultet “Mihajlo Pupin” Zrenjanin

SEMINARSKI RAD Predmet: Poslovna inteligencija

Profesor: Dr. Biljana Radulović

Student: Marko Lalović IM/272/11

1. UVOD Informacija predstavlja shvaćen, iskorišćen podatak odnosno podatak koji ukida ili smanjuje neodreĊenost. Gledajući iz poslovne perspektive informacija predstavlja jedan od najznaĉajnijih resursa u preduzeću. Preduzeće je dinamiĉki sistem koji odašilje podatke o svojim stanjima. Ti podaci se registruju u raznim vrstama informacionih sistema, dokumentima, poslovnim knjigama i na drugim nosiocima informacija. Procesiranje tih podataka, pronalaţenje, odnosno transformacija podataka u informacije predstavlja znaĉajan razvojni potencijal svakog preduzeća. Informacije su kljuĉni faktor u donošenju odluka na bilo kom nivou, poĉev od operativnog, preko srednjeg do strateškog nivoa odluĉivanja. Shodno vaţnosti svake odluke, informacije na bazi kojih se ona donosi moraju da zadovolje odreĊene standarde – da budu potpune, precizne i pravovremene. Sa dinamiĉnim razvojem informacionih tehnologija prikupljanje, ĉuvanje, analiza obrada i korišćenje informacija, a kao posledica toga i savremeni menadţment i komunikacija sa okruţenjem poprimaju sasvim drugaĉiji karakter. Osnovna ideja o primeni IT-ja u preduzeću se zasniva na potrebi da se poveća produktivnost, efikasnost i efektivnost u odvijanju poslovnih procesa. Poslovna Inteligencija je oblast u okviru IT, ĉiji je cilj da sveukupne informacione potencijale preduzeća stavi u funkciju donošenja najkvalitetnijih odluka, a sve to da bi se ostvarili utvrĊeni strateški ciljevi preduzeća. Poslovna Inteligencija je kompleksna oblast koja ukljuĉuje razne vrste tehnologija i pristupa iz oblasti informacionih tehnologija menadţmenta, statistike i matematike.

2. ŠTA JE POSLOVNA INTELIGENCIJA? Poslovna Inteligencija (eng. Business Intelligence – BI) predstavlja korišćenje svih potencijala podataka i informacija u preduzeću radi donošenja boljih poslovnih odluka i u skladu s tim identifikaciju novih poslovnih mogućnosti. Koncepti Poslovne Inteligencije nisu novi, ali su se razvijali uporedo sa razvojem informacionih tehnologija od poĉetnih mainframe arhitektura, pa do savremenih koncepata, kao što su data warehousing aplikacije. U dinamiĉnom poslovnom okruţenju kakvo je danas, od kljuĉnog znaĉaja za organizaciju je da obezbedi jeftin i brz pristup podacima za širok krug poslovnih korisnika ako ţeli da opstane u novom milenijumu. Rešenje ovog problema je sistem Poslovne Inteligencije koji predstavlja skup tehnologija za snabdevanje informacijama korisnike koji treba da donesu odluke na strateškom nivou. Mnogi koncepti poslovne inteligencije nisu novi, ali su bili razvijani tokom vremena koristeći iskustva host-baziranih informacionih sistema i kasnije data warehousing-a.

3. RAZVOJ POSLOVNIH INFORMACIONIH SISTEMA Prvo pitanje koje se postavilo prilikom opisivanja ciljeva poslovne inteligencije je: “Zar poslovna inteligencija nema iste ciljeve kao i data warehouse?’’ Sliĉno to pitanje se postavilo i kada je razivjan koncept data warehouse: “Zar nije data ware house sliĉan poslovnim informacionim sistemima i informacionim centrima koji su se u to vreme već koristili?’’. Iako je odgovor na oba pitanja potvrdan, detaljnije prouĉavanje pokazuje da kao što izmeĊu poslovnog informacionog sistema i data warehouse-a postoje znaĉajne razlike tako se i izmeĊu poslovne inteligencije i data warehouse-a mogu uoĉiti znaĉajne razlike. Evolucija poslovnih sistema tekla je u tri globalne faze:  Host bazirani upiti i izveštaji  Data warehousing  Poslovna inteligencija

Prva generacija: Host bazirani upiti i izveštavanje Prvobitni poslovni informacioni sistemi bili su bazirani na batch aplikacijama, koje su korisnicima obezbeĊivale potreban nivo informacija. Izlazi (outputi) iz takvih informacionih sistema su bile gomile papira iz kojih su korisnici detaljnom analizom morali da naĊu odgovore na svoje poslovne probleme. Prednost takvih sistema je brz pristup informacijama, a opet priliĉno su nezgrapni za korišćenje i zahtevaju komplikovane operacije pristupa transakcionim bazama podataka. Zbog toga je te informacione sisteme direktno koristilo samo tehniĉko osoblje koje je posedovalo veliko znanje i iskustvo u radu sa raĉunarima. Menadţeri i ostali poslovni korisnici dobijali su svoje informacije posredno, od tehniĉkog osoblja “iz druge ruke’’ jer nisu bili u stanju da efikasno koriste te sisteme.

Druga generacija: Data warehousing Druga generacija poslovnih informacionih sistema stupila je na scenu sa pojavom koncepta i tehnologije data warehouse-a.

Slika: 1. Evolucija poslovnih informacionih sistema Data warehouse se moţe definisati kao kolekcija informacija organizovanih tako da se moţe lako analizirati, izdvojiti, sintetizovati i na drugi naĉin koristiti da bi se razumela suština informacija. Data warehouse donosi nove mogućnosti i prednosti u odnosu na prvu generaciju poslovnih informacionih sistema: Data warehouse je dizajniran da neprekidno zadovoljava potrebe poslovnih korisnika, a ne samo dnevne operativne potrebne. Data warehouse informacija je ĉista i jasna, bez potrebe da je tehniĉko osoblje interpretira, u obliku koji poslovni korisnik moţe da razume. Sadrţi i informacije o prethodnom poslovanju, a ne samo informacije o trenutnom. Znaĉajno je unpreĊen korisniĉki interfejs sa pojavom alata za podršku odluĉivanju.

Treća generacija: Poslovna Inteligencija Data warehouse još ne predstavlja potpuno rešenje za sve potrebe poslovnih korisnika. Jedna od mana druge generacije poslovnih informacionih sistema jeste to što je ona uglavnom usredsreĊena na tehnologiju, a ne na poslovne probleme. Nema sumnje da na trţištu postoji veliki broj moćnih data warehouse proizvoda i rešenja. MeĊutim, implementacija takvih rešenja je priliĉno naporna.

Slika: 2. Konceptualna arhitektura Poslovne Inteligencije Sistemi poslovne inteligencije su usredsreĊeni na poboljšanje mogućnosti za pristup i distribuciju informacija, kako onima koji prave informacije, tako i onima koji ih koriste. Ostvarenje tog cilja omogućavaju napredni grafiĉko orijentisani i web orijentisani OLAP sistemi. Takvi sistemi su u mogućnosti da procesiraju i analiziraju velike koliĉine podataka koristeći veliki broj namenskih alata. Generalno, sistemi poslovne inteligencije moraju da obezbede skalabilnost i da budu u stanju da podrţe i integrišu proizvode razliĉitih proizvoĊaĉa. Ti sistemi takoĊe moraju da pojednostave pristup poslovnim informacijama korišćenjem kataloga informacija da bi objekte za podršku odluĉivanju mogli da koriste poslovni korisnici za rešavanje problema. Sistemi poslovne inteligencije moraju da budu projektovani da podrţe pristup svim oblicima informacija, a ne samo data wareouse sistemu. Pritom se ne negira znaĉaj i uloga warehousa, već se jednostavno naglašava da je on samo jedan od izvora informacija koje obraĊuju sistemi poslovne inteligencije. Osnovne karakteristike treće generacije poslovnih informacionih sistema su : Fokusirani na pristup i distribuciju poslovnih informacija krajnjim korisnicima Podrţavaju pristup svim vidovima poslovih informacija, a ne samo informacijama koje se nalaze u data warehouse-u.

4. DATA WAREHOUSE Pojam data warehouse-a Pre nego što se detaljnije uĊe u razradu pojma data warehouse-a i ostalih tehnika poslovne inteligencije, potrebno je uvesti i objasniti neke od osnovnih tehniĉkih pojmova koji će biti korišćeni u daljem tekstu. Operativno poslovanje u osnovi koristi konvencionalne baze podataka, koje se uglavnom zasnivaju na relacionom modelu. Njih karakterišu maksimalno normalizovani podaci, kako bi se obezbedila konzistentnost i izbeglo udvajanje (ponavljanje) podataka. To meĊutim sa druge strane dovodi do povećanja vremena izvršenja transakcija i upita. Nad tim bazama rade aplikacije koje su transakciono orijentisane, i koriste se za unos novih podataka ili generisanje prostih statiĉkih izveštaja. Ovakav reţim rada naziva se OLTP (On Line Transaction Processing). OLTP – Opisuje naĉin na koji raĉunarski sistemi i krajnji korisnici obraĊuju podatke. On je orijentisan na detalje, sa ĉestim aţuriranjem od strane krajnjih korisnika, Ĉesto se opisuje kao naĉin korišćenja raĉunara za voĊenje neprekidnih (trajnih) poslovnih procesa. Data warehouse je definisan kao skup informacija organizovanih tako da se mogu lako analizirati, izdvojiti, spojiti i na druge naĉine koristiti da bi se razumela njihova suština. On predstavlja neku vrstu baze podataka, s tim što su podaci u njemu organizovani na poseban naĉin. Ovi podaci mogu se nazvati i ,"informacionim podacima" za razliku od operativnih podataka u transakcionim bazama. Bill Inmon uvodi pojam data warehouse-a 1990. godine. Njegova definicija glasi: ‚‚Data warehouse je predmetno-orijentisan, integrisan, vremenski promenljiv i odrţiv skup podataka, koji pruţa podršku menadţmentu u procesu donošenja odluka. `` predmetno-orijentisan - podatak daje informaciju o konkretnoj temi umesto o trajnim procesima preduzeća integrisan - podaci su prikupljeni iz mnoštva razliĉitih izvora, i sklopljeni u koherentnu celinu vremenski-promenljiv - svi podaci u data warehouse-u su odreĊeni za neki vremenski period. Podaci u data warehouse-u su denormalizovani (relaksirani), izvršavanje upita nad tako organizovanim podacima je znatno brţe. TakoĊe, pojednostavljuje se šema baze podataka, tako da je olakšano pretraţivanje i osoblju koje nije tehniĉki osposobljeno za izvršavanje sloţenih upita nad relacionim bazama podataka. Data warehouse podrţava reţim rada koji se naziva OLAP (On-Line Analitical Processing). OLAP – je vrsta tehnologije koja omogućava analitiĉarima i menadţerima uvid u podatke kroz brz, konzistentan i interaktivan pristup velikom broju raznovrsnih izveštaja saĉinjenih na osnovu informacija dobijenih transformacijom sirovih podataka, koje oslikavaju sve dimenzije jednog poslovnog poduhvata. Data warehouse sadrţi veliku koliĉinu podataka koji su organizovani u manje logiĉke jedinice koje se nazivaju data mart-ovi, Oni predstavljaju podskup logiĉki povezanih podataka iz data warehouse-a koji se odnose na odreĊenu oblast poslovanja, i formiraju se sa namerom da budu osnova za potencijalne upite od strane krajnjih korisnika.

Podaci smešteni u data warehouse dobijaju se najĉešće transformacijom podataka iz operativne baze podataka, kao i iz ostalih internih i eksternih izvora.

Marketing Spreadsheet-ovi SD

PRO

Prodaja Raĉunovodstvo Finansije Ljudski resursi

Professional Workstation 6000

Prodaja

Operativni sistemi Finansije

Eksterni podaci

Data Warehouse

Data mart

Slika:3. Koncept data warehouse Meta-podaci – predstavlja vrstu informacija koje opisuju podatke smeštene u bazu podataka i sadrţe sledeće informacije: Opis tabela i polja u data warehouse-u, ukljuĉujući tipove podataka i opseg dozvoljenih vrednosti. Sliĉan opis tabela i polja izvornih baza, i opis preslikavanja polja iz izvorne baze u warehouse. Opis kako su podaci transformisani ukljuĉujući i formule i formate. Sve ostale informacije potrebne za podršku i upravljanje funkcionisanjem data warehouse-a. Drill-down – se moţe opisati kao sposobnost da se kreće kroz informacije, prateći hijerarhijsku strukturu. Data mining – proces izdvajanja taĉnih, korisnih, prethodno nepoznatih i razumljivih informacija iz podataka, i njihovo korišćenje za donošenje odluka.

Operacione i informacione baze podataka (OLTP vs OLAP) Obzirom na razlike koje postoje izmeĊu konvencionalnih (transakcionih) baza podataka i data warehouse-a, razlikuju se i dve vrste informacionih sistema. ‚‚Transakciono-operativni" informacioni sistemi pruţaju podršku svakodnevnom poslovanju (obrada faktura, otpremnica, podaci o proizvodnji itd). Sa druge strane, ,,analitiĉki" informacioni sistemi fokusirani su na analizu podataka kao podrška u donošenju odluka u poslovnim procesima. Data warehouse ne sadrţi on-line tekuće podatke iz poslovanja, već je odvojen od transakcione baze i periodiĉno se puni novim podacima. OLAP, odnosno analitiĉko procesiranje podataka karakteriše dinamiĉka, multi-dimenzionalna analiza konsolidovanih poslovnih podataka, koja pruţa podršku krajnjim korisnicima u sledećim aktivnostima:  Proraĉunima i modeliranju kroz razliĉite dimenzije i hijerarhijske nivoe.  Analizi trendova u sekvencijalnim vremenskim periodima.

  

Drill-down do niţih nivoa konsolidovanih podataka. Dostizanju do ‚‚podataka ispod podataka". Prikazu rezultata višedimenzionalnih poreĊenjenja.

OLAP sistemi imaju sposobnost da daju odgovore na pitanja "ko" i "šta", ipak ono po ĉemu se razlikuju od data warehouse sistema jeste njihova mogućnost da pruţe odgovore na pitanja "šta ako" i "zašto". Na taj naĉin OLAP omogućava odluĉivanje o akcijama u budućnosti. OLAP i data warehouse sistemi su komplementarni. Data warehouse ĉuva i upravlja podacima, dok OLAP transformiše ove podatke u strateške informacije. OLAP obuhvata opseg operacija od jednostavnog pregleda informacija, do ozbiljnih analiza kao što su vremenske serije i kompleksno modeliranje. Donosioci odluka korišćenjem OLAP sistema na taj naĉin prolaze put od prostog pristupa podacima, do dobijanja potrebnih informacija i u krajnjoj liniji znanja. Glavna razlika izmeĊu operacionih i informacionih baza podataka predstavlja uĉestanost aţuriranja Kod operativnih baza podataka, odvija se veliki broj transakcija u toku svakog sata. Baza je je u svakom trenutku ‚‚up to date``i oslikava trenutnu situaciju u poslovanju. Informacione baze podataka su obiĉno stabilne (nepromenljive) u toku odreĊenog vremenskog perioda i izraţavaju stanje preduzeća u specifiĉnom trenutku u prošlosti. Zato se podaci u data warehouse-u mogu nazvati istorijskim podacima. Na primer: ako pretpostavimo da se data warehouse obiĉno puni u toku noći, ovaj proces punjenja warehouse-a izdvaja sve promene i nove zapise iz operacione baze podataka, i ubacuje ih u informacionu bazu. Ovaj proces se moţe predstaviti kao jedinstvena transakcija koja poĉinje kada se prvi slog iz operacione baze izdvoji, a završava se kada se podaci u poslednjem data mart-u aţuriraju. OPERATIVNE

sv O

U

i eţ

ba

ci

INFORMACIONE

Aţuriraj

m Pro

en

Ubaci

Ubaci

Ubaci

Ubaci

Ubaci

Ubaci

Izbaci

i

Podaci se redovno aţuriraju po principu ‚‚slog po slog``

Izb

riš

i

Podaci se uĉitavaju u warehouse, odakle im se moţe pristupiti, ali se NE ‚‚update-uju”

Slika: 4 Operativne nasuprot informacionim bazama podataka Slika 4. pokazuje neke od glavnih razlika izmeĊu operativnih i informacionih baza podataka.

OLAP kocke podataka (data cubes) OLAP tehnologija organizuje izabrane podatke iz data warehouse-a, relacionih baza podataka, i drugih izvora podataka u multidimenzionalne nizove podataka koji se ĉesto nazivaju i kocke podataka. Kocke podataka predstavljaju modele poslovnih procesa i korisnici njihovom upotrebom mogu da mere performanse tih procesa i upravljaju njima. Kocke podataka su fleksibilne sa aspekta informacija koje sadrţe i kalkulacija koje se nad njima mogu izvršiti. OLAP izveštaji se izraĊuju na bazi kocaka podataka. Pošto svaka kocka podataka sadrţi više dimenzija i mera, od informacija u kocki podataka se moţe dobiti veliki broj razliĉitih izveštaja. Kocka podataka se moţe posmatrati i kao kolekcija komponenata koje mogu da se kombinuju da bi se dobio neki specifiĉan izveštaj. Dimenzije su prikazane sa „istorijskog“ ili „aktuelnog“ aspekta da bi pokazale, na primer trenutno vaţeću raĉunovodstvenu strukturu, ili raĉunovodstvenu strukturu koja je vaţila u vreme ostvarenja prihoda. Ovi sistemi se paţljivo konfigurišu i odrţavaju zbog vaţnih problema koji mogu da se jave: OLAP sistemi koriste svoja, redudantna skladišta podataka, i veoma su osetljivi na strukturu i kvalitet podataka. Mnoge OLAP kocke su primenjene za više specifiĉnih potreba u isto vreme. Zbog toga one moraju biti sinhronizovane i harmonizovane sa relacionom bazom podataka kojoj pristupaju izveštajne aplikacije. Kako su analitiĉke potrebe samo delimiĉno predvidive, izvršavanje je kritiĉno i mora se neprekidno nadzirati. Potreba za sve sloţenijim merama i dimenzijama dovodi do teških i vremenski zahtevnih procesa odrţavanja. Nekim merama je potreban i istorijski i aktuelni aspekt. Ispunjavanje oba zahteva vodi usloţnjavanju "kocki" i oteţavanju njihove pravilne upotrebe.

Dimenzije Region sever jug istok

Mesec

Proizvod

Jan Feb Mart Monitori Procesori Hard diskovi

Slika: 5. Kocka podataka

Uz ove operativne probleme, korisnici koji pristupaju kockama moraju da razumeju korišćenu tehnologiju i problem na kome rade. U poreĊenju sa izveštajnim rešenjima, koja su obiĉno podešena da definišu analitiĉke potrebe, korisnik OLAP mora sam da odredi svoj "poslovni upit" i da razume mogućnosti i ograniĉenja alata, kao i dostupne mere i dimenzije.

Tipovi organizacije podataka u OLAP-u Postoje tri tipa organizacije podataka kod OLAP-a:   

Multidimenzionalni OLAP (MOLAP) Relacioni OLAP (ROLAP) Hibridni OLAP (HOLAP)

MOLAP predstavlja tradicionalan naĉin OLAP analize. Ovde su podaci smešteni u multidimenzionalnu kocku podataka. Fiziĉka organizacija nije u relacionom modelu baze podataka, već u odgovarajućem formatu karakteristiĉnom za kocke podataka. Osnovne prednosti ovog tipa organzacije podataka su: odliĉne performanse i mogućnost izvoĊenja sloţenih kalkulacija (koje su ugraĊene u samu kocku podataka). Osnovni nedostaci su: ograniĉena koliĉina podataka sa kojima se radi (ne odnosi se na podatke od kojih se kocka pravi, već na kalkulacije koje su ugraĊene u kocku) i veliki investicioni zahtevi (obzirom da kocka podataka uglavnom ne postoji, tako da su potrebna znatna ulaganja u tehnologiju, projektovanje, obuku kadrova itd). ROLAP je metodologija koja se oslanja na rad sa podacima koji su smešteni u klasiĉnu relacionu bazu podataka uz mogućnost da se podacima manipuliše u "OLAP stilu". Prednosti ovog tipa organizacije podataka su: mogu da rade sa velikom koliĉinom podataka i mogu da koriste prednosti koje su svojstvene relacionom pristupu, Nedostaci se ogledaju u tome što performanse mogu da budu loše (svaki ROLAP izveštaj predstavlja jedan ili više SQL upita ĉije izvršavanje moţe da traje veoma dugo ako je baza podataka velika), i što je ograniĉen funkcionalnošću koju ima SQL (što onemogućava sloţene analitiĉke kalkulacije). HOLAP tehnologija kombinuje prednosti MOLAP i ROLAP pristupa. Za informacije sumarnog tipa HOLAP se oslanja na kocke podataka zbog boljih performansi ovakvog pristupa. Za detaljne informacije, sa druge strane, HOLAP vrši generisanje kroz relacioni pristup.

Odnos multidimenzionalnih analiza i SQL pristupa Analitiĉari u svom radu koriste multidimenzionalni opis podataka. Numeriĉke vrednosti (mere) opisane su odreĊenim brojem kategorija ili dimenzija, koje su organizovane u hierarhije (npr. Mesec/kvartal/godina). SQL relacioni sistemi za upravljanje bazama podataka bazirani su na skupu teorijskih modela koji su po prirodi dvodimenzionalni. Dimenzije i hijerarhije se nalaze u više odvojenih tabela i procesiraju se kroz mehanizme primarnih i spoljnih kljuĉeva. Iz tog razloga, potrebno je pratiti svaku promenu hijerarhija i dimenzija i u skladu sa svakom izmenom menjati i odgovarajuće SQL upite za razne vrste sumiranja. Pošto relacione baze podataka nemaju direktnu

podršku za analitiĉke osobine, kao što su hijerarhije, iterativne analize i dimenzionalne operacije, potrebno je definisati logiku van same baze podataka za prevoĊenje multidimenzionalnog modela podataka u dvodimenzionalni. Multidimenzionalne baze podataka organizuju podatke onako kako će oni biti korišćeni u analitiĉkim procesima. Pristup podacima je na bazi pozicije koja je odreĊena dimenzionalnim koordinatama, a ne vrednošću. Svaka mera je smeštena kao skup numeriĉkih vrednosti indeksiranih po ĉlanovima svake dimenzije. Svaka taĉka multidimenzionalnog prostora je mapirana odgovarajućom taĉkom na disku na kojoj je smeštena informacija. Taj princip je moguć zato što su ĉlanovi dimenzija statiĉke kategorije i broj mogućih taĉaka je unapred poznat. Takav mehanizam skladištenja podataka je mnogo efikasniji od relacionog mehanizma sa aspekta anlitiĉkih procesa koji se odvijaju nad podacima.

Data Warehouse arhitektura Arhitektura data warehouse sistema data je na slici 6. Sa date šeme moţe se zakljuĉiti da se data warehouse sistem sastoji iz sledećih slojeva (nivoa):

Operativne baze podataka

Eksterni izvori Ekstrakcija / Umnoţavanje podataka Transformacija / Ĉišćenje podataka

Dimenzije „zvezda“ šeme ODS

ĉinjenice Prerada podataka

Multidimenzionalna Relaciona

API ODBC, SQL

Meta podaci

Alati za prezentaciju i analizu

Data mart

Slika: 6. Arhitektura data warehouse sistema        

Izvori podataka (Data sources) Ekstrakcija / umnoţavanje podataka (Extraction / Propagation) Transformacija / ĉišćenje podataka (Transformation / Cleansing) Prerada podataka (Data refining) Fiziĉki model baze podataka (Physical database model) Logiĉki model baze podataka (Logical database model) Meta-podaci (Metadata information) Izvor operativnih podataka (ODS - Operational Data Source)

 

Data mart Alati za analizu i prezentaciju (Analysis and Presentation tools)

U daljem tekstu biće pojedinaĉno obraĊen svaki od slojeva ovog sistema.

Izvori podataka Izvori podataka mogu biti operativne baze podataka, istorijski podaci (obiĉno saĉuvani na trakama), eksterni podaci (npr. od kompanija koje se bave istraţivanjem trţišta, ili sa Interneta), ili informacije sa već postojećih data warehouse sistema. To mogu biti i relacione baze podataka koje koriste poslovne aplikacije. Mogu se nalaziti na raznim platformama koje sadrţe strukturirane podatke kao što su tabele ili spreadsheetovi, ili nestrukturirane podatke kao što su tekstualni fajlovi, fotografije i multimedijalni sadrţaji.

Ekstrakcija / umnoţavanje podataka (Extraction / Propagation) Ekstrakcija/umnoţavanje podataka je proces prikupljanja podataka iz razliĉitih izvora i platformi i smeštanja tih podataka u data warehouse. Ekstrakcija podataka u data warehouse okruţenju, predstavlja selektivni proces unošenja informacija bitnih za odluĉivanje u data warehouse. Ekstrakcija/umnoţavanje podataka je mnogo više od prostog kopiranja podataka sa jednog sistema na drugi. U zavisnosti od tehnike ovaj proces moţe biti ili: Pushing (ekstrakcija/izvlaĉenje podataka) ili Pulling (umnoţavanje/ubacivanje podataka)

Transformacija / ĉišćenje podataka (Transformation / Cleansing) Transformacija obiĉno podrazumeva razrešenje koda pomoću tabela za mapiranje (npr pretvaranje 0 u "ţensko" i 1 u "muško" u polju tabele odreĊenom za pol), i odreĊivanje skrivenih poslovnih pravila. TakoĊe se ureĊuju struktura i veze izmeĊu podataka za oblast analize. Transformacija se vrši u toku procesa popunjavanja, i to obiĉno u više koraka. U ranijim fazama procesa transformacija se uglavnom koristi za konsolidaciju podataka dobijenih iz razliĉitih izvora, dok se u kasnijim fazama podaci transformišu za potrebe specifiĉnih problema analize ili analitiĉkih alata. Dok sa jedne strane, data warehouse pretvara podatke u informacije, sa druge strane ĉišćenje osigurava da data warehouse sadrţi taĉne korisne informacije, i informacije koje imaju smisao. Ĉišćenje podataka se takoĊe moţe opisati i kao standardizacija podataka.  Paţljivim pregledom sadrţine podataka, dobijaju se:  Taĉna imena preduzeća i kupaca.  Taĉne i validne adrese.  Korisni brojevi telefona i kontakt podaci.  Taĉni kodovi podataka i skraćenice.  Konzistentan i standardan prikaz podataka.  Konsolidacija podataka.

Prerada podataka (Data refining) Prerada podataka podrazumeva kreiranje podskupova (podnizova) data warehouse-a, koji imaju multidimenzionalni ili relacioni format organizacije podataka, za OLAP obradu. Nad informacijama koje se dobijaju iz logiĉkog modela baze (najĉešće organizovanom po "star - join" šemi), mora da se izvrši agregacija, sumiranje i modifikacija prema specifiĉnim zahtevima. Ovaj sloj data warehouse arhitekture je potreban za poboljšanje performansi upita, smanjenje koliĉine podataka koji se preko mreţe šalju krajnjem korisniku ili alatima za analizu i generisanje data martova. Kada govorimo o preradi podataka postoje dva razliĉita naĉina na koja se mogu ostvariti rezultati: Agregacijom podataka - promenom granularnosti podataka (npr. originalni podaci sadrţe svakodnevne vrednosti, dok data mart sa druge strane sadrţi vrednosti na nedeljnom nivou). Na taj naĉin agregacija podataka smanjuje broj slogova u bazi. Sumiranjem podataka - dodavanjem vrednosti u odreĊene grupe informacija (npr. proces prerade podataka generiše slogove koji sadrţe prihode po specifiĉnim grupama proizvoda i na taj naĉin povećavaju broj slogova ).

Fiziĉki model baze podataka (Physical database model) Kada govorimo o fiziĉkom modelu baza podataka u poslovnoj inteligenciji, tada govorimo o relacionim ili multidimenzionalnim modelima podataka. Slika 7. prikazuje razliku izmeĊu ova dva modela. Obe vrste modela se koriste za kreiranje data mart-ova, ali je naĉin pristupa podacima u bazi drugaĉiji: Za pristup podacima smeštenim u relacionim bazama, najĉešće se koriste metode klasiĉnog pristupa podacima kao što je SQL ili middleware proizvodi kao što je ODBC. Multidimenzionalne baze zahtevaju specijalizovane API-e (Application programming interface) za pristup ovakvim arhitekturama. Fizički modeli

Multidimenzionalni model

Slika: 7. Fiziĉki modeli baza podataka

Relacioni model

Logiĉki model baze podataka (Logical Database Model) U skladu sa prethodno pomenutim fiziĉkim modelom, postoji i adekvatan logiĉki model baze podataka. Logiĉki model je potreban, pre poĉetka implementacije data warehouse-a zbog: Prepoznavanja redudanse - model objašnjava lokaciju elemenata informacije u data warehouse-u Promena u budućnosti - prikaz strukture pruţa mogućnost ukljuĉivanja novih informacionih elementata na odgovarajuće mesto i pomaţe u analizi uticaja promene podataka. Kompletnosti prikaza - Razvojni tim treba da bude usmeren kroz ceo ţivotni ciklus data warehouse-a, pa u tom smislu logiĉki model predstavlja plan njegove realizacije i implementacije. U poslovnoj inteligenciji, najĉešći model logiĉke organizacije baze podataka je "star join" šema, koja se sastoji od dve komponente sa razliĉitim karakteristikama: Tabela ĉinjenica - Daje odgovor na pitanje:"Šta merimo?". Sadrţi numeriĉke vrednosti koje predstavljaju meru performansi kompanije. Sastoji se iz velikog broja kratkih slogova. Tabela dimenzija - Sadrţi opis numeriĉkih vrednosti koje se nalaze u tabeli ĉinjenica. Strukturu ĉine dugaĉki, denormalizovani slogovi, i ima ih manje nego u tabeli ĉinjenica.

Sadrţaj tabele ĉinjenica Informacije koje se nalaze u tabeli ĉinjenica moraju da imaju sledeće karakteristike: Numeriĉke vrednosti – upiti u data warehouse-u udruţuju hiljade slogova, te zbog toga vrednosti moraju da budu numeriĉke kako bi se generisale proseĉne ili sumarne vrednosti. Aditivne vrednosti - Kako bi sumirali veliki broj vrednosti, one moraju da budu aditivne kako se ne bi generisale netaĉne i konfuzne informacije. Kontinualno vrednovane - Kako bi se pratile i ocenjivale promene u kompaniji u toku vremena, vrednosti moraju da budu kontinualne, t.j. da mogu da dobiju bilo koju vrednost iz najšireg opsega vrednosti. ObraĊene vrednosti moraju da adekvatno oslikavaju performanse kompanije u toku vremena.

Sadrţaj tabele dimenzija Tabela dimenzija mora da bude što je moguće deskriptivnija i treba da sadrţi : Deskriptivne atribute - za identifikovanje okolnosti zbog kojih je došlo do generisanja sloga u tabeli ĉinjenica. Denormalizovanu strukturu slogova - treba izbegavati višestruke upite kako bi se našao opis odreĊenog atributa dimenzije ("vrsta kupaca" u dimenziji "kupci" treba da bude tekstualno polje a ne numeriĉka vrednost koja pokazuje na neki drugi slog u nekoj drugoj tabeli)

Tekstualni opisi - sadrţaji atributa u tabeli dimenzija koriste se kao zaglavlja redova i kolona na prezentacionom nivou data warehouse-a, tako da tekstualni opisi uprošćuju generisanje izveštaja. Sadrţaj tabele dimenzija i struktura sloga je sledeća: Tabela dimenzija sadrţi nekoliko atributa kojima detaljno opisuje entitet. Svi atributi mogu da se iskoriste za generisanje razliĉitih pogleda na informaciju u tabeli ĉinjenica. Atributi treba da budu predstavljeni u tekstualnom formatu - ove vrednosti se kasnije mogu iskoristiti kao zaglavlja kod izveštavanja. Izbegavati skraćenice ili nenumeriĉke vrednosti za prikaz stanja ili grupe. Vrednosti koje nisu od znaĉaja za OLTP sistem mogu imati veliki znaĉaj u data warehouse-u. Primarni kljuĉ u OLTP sistemima, nije obavezno i primarni kljuĉ u data warehouse-u. Ralph Kimball kaţe: "Devet taĉaka u vezi kojih je vaţno donošenje odluka, u kompletnom projektovanju data warehouse-a su:  Procesi tabele ĉinjenica.  Granularnost svake tabele ĉinjenica.  Dimenzije svake tabele ĉinjenica.  Izbor ĉinjenica ukljuĉujući i pre-kalkulisane ĉinjenice.  Atributi dimenzija sa kompletnim opisima i terminologijom.  Kako pratiti dimenzije koje se sporo menjaju ?  Agregacije, heterogene dimenzije, mini dimenzije, razni oblici upita i druge odluke vezane za fiziĉka skladišta.  Istorijsko trajanje baze podataka.  Hitnost ekstrakcije i ubacivanja podataka u data warehouse. "

Meta podaci Meta-podaci su podaci o podacima. Oni ukljuĉuju opise elemenata podataka kao što su opisi tipova podataka, opisi atributa, opisi domena, zatim nazive, veliĉinu i dozvoljene vrednosti elemenata podataka. Meta podaci strukturiraju informacije u data warehouse-u u kategorije, teme, grupe, hierarhije itd. Oni sluţe da pruţe informacije o podacima koji su smešteni u data warehouse i imaju sledeće karakteristike: Predmetno su orijentisani - zasnivaju se na apstrakciji realnih entiteta (npr. projekat, kupac, organizacija... ) Definiĉu naĉin na koji će se transformisani podaci interpretirati (npr. 5/9/99 kao 5. septembar 1999. ) Pruţaju informacije o srodnim podacima u data warehouse-u PredviĊaju vreme odziva, prikazujući broj slogova koji treba da se obradi u upitu. Ĉuva izraĉunate vrednosti i prekalkulisane formule kako bi se izbegla loša interpretacija. Sa stanovišta administratora data warehouse-a, meta-podaci predstavljaju skladište podataka i dokumentaciju o sadrţaju i procesima u data warehouse-u. Sa druge strane sa stanovišta korisnika meta-podaci predstavljaju mapu za kretanje kroz informacije.

Vrste meta-podataka Korisnici meta-podataka se okvirno mogu podeliti na kategorije poslovnih korisnika i tehniĉkih korisnika. Obe ove grupe sadrţe veliki broj razliĉitih vrsta korisnika kojima su meta-podaci potrebni za efikasno korišćenje informacija u data warehouse-u. Stoga razlikujemo dva tipa meta-podataka: poslovne i tehniĉke meta-podatke. Tehniĉki meta-podaci obezbeĊuju sigurnost korisnicima sistema za podršku odluĉivanju da su podaci u data warehouse-u taĉni. TakoĊe, tehniĉki meta-podaci su neophodni za odrţavanje i rast data warehouse-a, bez kojih je proces analize i implementacije promena znatno komplikovaniji i duţi. Poslovni meta-podaci obezbeĊuju vezu izmeĊu data warehouse-a i poslovnih korisnika, i predstavljaju mapu za pristup podacima u data warehouse-u i data mart-ovima. Pošto poslovni korisnici obiĉno imaju manjak tehniĉkog znanja, potrebno je da sistemi koje koriste za podršku odluĉivanju budu konstruisani tako da budu u skladu sa njihovim potrebama u poslovnom smislu, što je upravo uloga poslovnih meta-podataka. Kada govorimo o izvorima meta-podataka, postoje dve vrste izvora:formalni i neformalni.Formalni izvori meta-podataka su oni izvori za koje postoji dokumentacija, dogovor i saglasnost donosilaca odluka u preduzeću. Formalni meta-podaci se odiĉno ĉuvaju u dokumentima i alatima koji se mogu naći u raznim delovima organizacije. Ovi podaci ĉine sadrţinu i tehniĉkih i poslovnih meta-podataka. Neformalni meta-podaci sastoje se od znanja, pravila i uputstava koji nisu u standardnoj formi. To su informacije koje ljudi jednostavno znaju. Ove informacije se nalaze u "svesti kompanije", i nisu dokumentovane ili dogovorene, ali su podjednako vaţne kao i one u formalnim izvorima meta-podataka. Veoma ĉesto neformalni meta-podaci pruţaju i najvaţnije informacije obzirom da su najĉešće te informacije poslovne prirode. Vaţno je napomenuti da je većina meta-podataka iz neformalnih izvora pa je veoma bitno prikupiti, dokumentovati, formalizovati i predstaviti ove podatke u data warehouse-u, i tako neformalne izvore transformisati u formalne. Obzirom da se svaka organizacija razlikuje, nemoguće je taĉno definisati koji su to neformalni izvori meta-podataka, ali se moţe dati lista najĉešćih vrsta neformalnih meta-podataka:  Poslovna pravila  Poslovne odluke  Lista proizvoda konkurencije

Izvor operativnih podataka (ODS - Operational Data Source) Izvor operativnih podataka moţe se definisati kao skup integrisanih podataka koji se koriste za donošenje strateških odluka preduzeća. On sadrţi "ţive" podatke, ne pregled stanja i vrlo malo informacija o prošlim stanjima izvora. Neke od karakteristika izvora operativnih podataka su: ODS je predmetno orijentisan: projektovan je i organizovan oko glavnih predmeta interesovanja kompanije kap što su kupac i proizvod. ODS je integrisan: on predstavlja integrisanu sliku predmetno orijentisanih podataka izvuĉenih iz bilo kog operativnog sistema.

ODS je orijentisan na trenutnu vrednost: on oslikava trenutni sadrţaj njegovih izvornih sistema, pri ĉemu se trenutna vrednost moţe definisati na razliĉite naĉine za razliĉite izvore u zavisnosti od zahteva implementacije. Pri tome ovaj izvor ne treba da sadrţi više prikaza trenutnog stanja, ma kako trenutno stanje bilo definisano. Ako je "trenutno" jedan raĉunovodstveni period, onda ODS ne sadrţi podatke za više od jednog raĉunovodstvenog perioda. ODS je promenljiv: kako je ODS orijentisan na predmet on je podloţan promenama onoliko ĉesto koliko je to potrebno za oslikavanje trenutnog stanja. To znaĉi da se podaci menjaju u stilu OLTP sistema, te će jedan isti upit dati razliĉite vrednosti u razliĉim trenutcima vremena, jer su se podaci u meĊuvremanu promenili. ODS je detaljan: definicija "detaljnog" takoĊe zavisi od problema koji se rešava. Granularnost ODS-a moţe ali ne mora da se razlikuje od granularnosti svog izvornog operativnog sistema.

Data mart Glavna svrha data mart-a je da obavlja sledeće funkcije:  Da ĉuva podatke u obliku u kom se nalaze pre agregacije.  Da kontroliše pristup krajnjih korisnika informacijama.  Da obezbedi brz pristup informacijama za specifiĉne analitiĉke potrebe.  Da kreira multidimenzionalni ili relacioni pogled na podatke. Sama organizacija data marta moţe biti relaciona ili multidimenzionalna.

Alati za analizu i prezentaciju (Analysis and Presentation tools) Sa aspekta krajnjeg korisnika ovaj sloj je najbitniji sloj u data warehouse arhitekturi. Kako bi se pronašli odgovarajući prezentacioni alati za informacione zahteve krajnjih korisnika, moţe se pretpostaviti da postoje ĉetiri kategorije korisnika kao i njihove kombinacije: "moćni korisnici" – korisnici koji su spremni i sposobni da koriste kompleksnije alate za kreiranje sopstvenih izveštaja i analiza. Oni poznaju strukturu data warehouse-a i meĊuzavisnosti koje vladaju u njegovoj organizacionoj formi. "povremeni korisnik" – ova grupa korisnika sastoji se od ljudi koje direktno nisu zainteresovani za detalje o data warehouse-u, ali im je povremeno potreban pristup informacijama. Ovi korisnici su obiĉno zauzeti svakodnevnim poslovima i nemaju vremena niti potrebu za opširnim radom sa informacijama, i njihove sposobnosti u korišćenju analitiĉkih alata su ograniĉene. Korisnici koji imaju potrebu za statiĉkim informacijama – ovi korisnici imaju potrebu za precizno definisanim podacima u odreĊenom vremenskom intervalu. Korisnici koji zahtevaju dinamiĉke ili ad hoc upite i analitiĉke mogućnosti alata – Ovo su uglavnom analitiĉari. Ovim korisnicima svaka informacija u data warehouse-u moţe biti znaĉajna u nekom trenutku. Zahtevaju visoke performanse i drill-down mogućnosti. Razliĉite vrste korisnika zahtevaju razliĉite prezentacione alate, ali svi mogu da pristupaju zajedniĉkom data warehouse-u.TakoĊe razliĉite sposobnosti korisnika odreĊuju i razne naĉine prezentacije rezultata obrade od grafikona do tabelarnih prikaza za sloţene analize. Sa napretkom tehnologije i povećanjem dinamike poslovanja data

warehouse sistemi postaju sve zahtevniji, baze podataka sve veće, a takoĊe se povećava i potreba za multimedijalnim podacima. U vremenu novih tehnologija, projektanti data warehouse sistema moraju i dalje da prate potrebe krajnjih korisnika i da primenom tih novih tehnologija obezbede najbolje moguće rešenje za preduzeće koje će biti funkcionalno i fleksibilno za tekuće, ali i buduće poslovanje.

5. ZAKLJUČAK Tehnološki napredak načinjen u nekoliko poslednjih decenija je omogućio organizacijama da sakupe veliki broj podataka. Ovi podaci, kada se interpretiraju, otkrivaju veoma vredne informacije. Osnovna premisa je da je stvorena inteligencija dobra samo onoliko koliko su dobri podaci i sistem / ljudi koji ih obradjuju. Prema tome, veoma je važno kako se poslovna inteligencija sakuplja, nastaje i razume. Savremeno elektronsko poslovanje danas je nezamislivo bez savremenih alata poslovne inteligencije. Bilo da se koristi data warehouse kao nov način organizacije podataka koji omogućuje lakši i efikasniji pristup poslovnim informacijama od strane poslovnih korisnika, bilo da se koristi data mining za pronalaženje znanja i paterna sakrivenih u poslovnim informacijama, nameće se činjenica da primena poslovne inteligencije postaje imperativ za uspešno i konkuretno poslovanje.

6. SADRŽAJ 1. UVOD……………………………………………………………………………………2 2. ŠTA JE POSLOVNA INTELIGENCIJA?...............................................................3 3. RAZVOJ POSLOVNIH INFORMACIONIF SISTEMA……………………………....3 4. DATA WAREHOUSE…………………………………………………………………...6 5. ZAKLJUĈAK……………………………………………………………………………18 6. SADRŢAJ………………………………………………………………………………..19 7. LITERATURA…………………………………………………………………………...20

7.Literatura 

Mahesh Raisinghani, Business Intelligence in the Digital Opportunities, Limitations and Risks, Idea Group Publishing, 2004.



Darko Krulj, Projektovanje i implementacija Data Warehouse i Data Mining sistema, Magistarski rad, FON, 2003.



Joerg Reinschmidt, Allison Francoise, Business Intelligence Certification Guide, e-book, IBM Redbooks, 2001.



Bojan Ćirić, Poslovna inteligencija, Data status, 2006.



[Grupa autora, Data Modeling Techniques for Data Warehousing, e-book, IBM Redbooks, 2001.



ZaoHui Tang and Jamie Mac Lennan, Data Mining with SQL Server, e-book, 2005.



Seth Paul, Jamie MacLennan, Zhaohui Tang, Scott Oveson, Data Mining Tutorial, Microsoft Corporation, 2005.

Economy:

Related Documents

Poslovna Inteligencija
February 2021 1
Poslovna-matematika
January 2021 1
Poslovna Pisma
January 2021 3
Poslovna Matematika
January 2021 1
Poslovna Statistika
February 2021 1
Poslovna Kultura
February 2021 1

More Documents from "Armin Wolf"

Poslovna Inteligencija
February 2021 1