در نخستین بخش از آموزش هوش تجاری قصد داریم شما را با مقدمه ای بر مباحث bi و مفاهیم Data Warehouse و Data Modeling و ابزار های SSIS , SSAS آشنا کنیم , با ما همراه باشید
پیشرفت فناوری اطلاعات و نیاز به هوش تجاری
درسه دهه اخیر با پیشرفت چشمگیر علم فناوری اطلاعات , مدیران سازمان ها به این بلوغ رسیده اند که باید فرآیندهای سازمان به صورت مکانیزه و سیستمی صورت گیرند. این مورد با تمام مزیت های آشکار از جمله سرعت و دقت بالا در انجام کارها باعث به وجود آمدن مجموعه ای از داده ها شد که از آن به عنوان معدن طلای سازمان یاد می شود. با گذشت زمان مدیران به این موضوع پی بردند که با استفاده از این داده های بسیار ارزشمند می توانند مدیریتی دقیق تر و ارزشمند تر داشته باشند ، به همین دلیل ابزارها و سیستم های گزارش ساز (گزارش های سنتی) پدید آمدند تا داده ها با فرمتی قابل فهم در اختیار مدیران قرار گیرد .
با گذشت زمان و افزایش حجم داده ، پیچیدگی کسب و کار ، توسعه ی سیستم های عملیاتی ، افزایش دانش و درخواست مدیران عواملی پیش آمد که گزارشات سنتی عملا کارایی خود را از دست دادند .برخی ازاین عوامل به شرح زیر می باشند :
- کندی گزارشات
- عدم پشتیبانی از تحلیل های پیچیده
- یکپارچه نبودن گزارشات
- عدم پاسخگویی به نیاز مدیران و تحلیل گران
- عدم فراگیری چند بعد از فرایند کسب و کار در یک گزارش
امروزه بسیاری از صاحبان کسب و کارها به شدت دنبال راهی برای کنترل و هدایت اهداف و شاخص های سازمان و به خصوص مشتریان خود هستند ، در واقع می دانند که قدرت داده می تواند باعث تحقق اهداف آن ها شود .
یکی از بهترین راههای مدیریت کسب و کار به وسیله داده اتخاذ راه اندازی هوش تجاری (BI) است.
هوش تجاری (Business Intelligence) چیست؟
هوش تجاری در اصطلاح مجموعه ای از روش ها و راهکار ها و تکنولوژی ها می باشد که با استفاده از آن و با تکیه بر تجربیات گذشته سازمان (داده) بتوان دانش ارزشمندی را برای فرایند تصمیم گیری در اختیار مدیریت قرار داد .
BI سازمان ها را قادر می سازد اطلاعات را از سیستم ها و منابع داخلی و خارجی جمع آوری کنند و سپس آن را برای تجزیه و تحلیل آماده کنند و در نهایت با ایجاد گزارش ها و داشبورد های نوین نتایج را برای تصمیم گیرندگان سازمان تجسم می کنند .
مراحل ایجاد سیستم هوش و کسب و کار
برای این که یک پروژه BI هدفمند و سودمند داشته باشیم ابتدا باید اهداف پروژه به خوبی شناخته شود و سپس در راستای آن اهداف شاخص ها و متریک های مورد نیاز استخراج شوند. هدف از پیاده سازی هوش تجاری در سازمان های مختلف الزاما یکی نیست و باید هدف مشخص شود تا بتوان هوش تجاری را به درستی پیاده سازی کرد .گاهی اوقات اهداف آن میان زیبایی داشبورد ها گم می شود و پس از مدتی عملا سیستم هوش تجاری کنار گذاشته می شود و یا حتی ممکن است سازمان را به بی راهه ببرد . باید به این نکته توجه داشته باشید که ممکن است که شاخص ها و متریک هایی که در نظر میگیرد کم اهمیت باشد و شاخص های مهم نادیده گرفته شوند و باز هم منجر به تصمیم گیری اشتباه شود. پس باید به خوبی شاخص ها توسط تحلیل گر سازمان شناسایی و تحلیل شوند .
1 - شناسایی اهداف در راه اندازی پروژه هوش تجاری
2 - تعیین شاخص ها و متریک های برای دستیابی به اهداف تعیین شده در هوش تجاری
3 - پیاده سازی داشبورد های هوش تجاری
مراحل پیاده سازی هوش تجاری از منظر کارشناس نرم افزار
پس از این که شاخص ها و متریک ها توسط تحلیل گر سازمان شناسایی شد شناسنامه شاخص به کارشناس نرم افزار جهت پیاده سازی سیستم هوش تجاری تحویل داده می شود. اولین قدم کارشناس نرم افزار در راه اندازی سیستم هوش تجاری این است که داده های مورد نیاز شاخص ها را از داده های پراکنده در یک مجموعه واحد به نام Data Warehouse تجمیع و پالایش کند .
این کار به وسیله لایه ETL انجام می شود . لایه ETL وظیفه خواندن داده از منابع داده مختلف (Extract) ، تغییر و تبدیل داده (Transform) و بارگزاری داده در Data Warehouse ) Loading) را برعهده دارد .توجه داشته باشید که لایه ETL یکی از پیچیده ترین و مهمترین لایه ها است ، اشتباه در این لایه ممکن است که سازمان را به مسیر ها و اهداف اشتباه هدایت کند .
Data Warehouse چیست ؟
مجموعه ای از داده چهار خصوصیت زیر را دارند : موضوع گرایی (Subject Oriented) ، یکپارچه بودن (Integrated) ، ماندگاری (Non Volatile) ، متغیر با زمان (time Variant)
1- Subject Oriented (موضوع گرایی)
اصلی ترین خصیصه Data Warehouse است . Subject ها همان موضوعات تحلیل کسب و کار است که می بایست در گام اول مشخص شوند . در هر کسب و کاری یکسری موضوعات تحلیلی داریم که از منظر همین موضوعات به مقادیر قایل سنجش نگاه میکنیم . از نمونه subject هایی که می توان مثال زد کالا ، زمان ، مشتری و …. است . به عنوان مثال بررسی میکنیم که کدام مشتری ها در ماه A بیشترین خرید را دارند ، در این مثال مشتری و زمان (ماه) موضوعات ما هستند .
بنابراین در سیستم هوش تجاری دونوع مجموعه داده داریم :
الف) مجموعه داده هایی که مورد سنجش و ارزیابی قرار می گیرد
ب ) مجموعه داده هایی که ابزار تحلیل ماست
2 – Integration (یکپارچگی)
در لایه ETL داده های مورد نیاز را از منابع داده مختلف مثل excel , Flat File , SQL Server و….در یک Data Warehouse تجمیع می کنیم و باید این داده ها یکپارچه باشند . در ادامه به سه مورد مهم که غالبا وجود دارند و باید یکپارچه شوند می پردازیم :
الف ) نوع داده (Data Type) :
فرض کنید که شما چندین دیتابیس مختلف برای فروش دارید و ستون جنسیت مشتری ها در یک دیتابیس به صورت F, M و در دیتابیس دیگر 0 و1 ذخیره می شود . شما باید این مورد را در هنگام تجمیع داده در Data Warehouse به یک Data Type واحد تبدیل کنید . مثلا F , M را به 0 و1 تبدیل کنید و در Data Warehouse به صورت bit ذخیره کنید .
ب ) فرمت داده (Data Format) :
فرض کنید که شما چندین دیتابیس مختلف برای فروش دارید و ستون جنسیت مشتری ها در یک دیتابیس به صورت F, M و در دیتابیس دیگر Male , Female ذخیره می شود . شما باید این مورد را در هنگام تجمیع داده در Data Warehouse یکسان کنید .
پ) واحد های اندازه گیری :
فرض کنید که شما چندین دیتابیس مختلف برای فروش دارید و مبلغ فاکتور یک دیتابیس به ریال و در دیتابیس دیگر دلار ذخیره می شود . شما باید این مورد را در هنگام تجمیع داده در Data Warehouse یکسان کنید .
3 – Non Volatile (ماندگاری داده)
این خصوصیت به این موضوع اشاره دارد که تغییرات داده درجداول پایه موضوعات مثل اطلاعات مشتری و کالا و .. باید در طی زمان ثبت و نگهداری شود . به مثال زیر توجه کنید
فرض کنید یک جدول موضوع مکان داریم . در واقع می خواهیم میزان فروش را بر اساس شهر بسنجیم . شهر کرج تا سال 1388 جزو استان تهران بود و بعد از آن به کرج ملحق شد . در واقع تراکنش های قبل از سال 1388 شهر کرج متعلق به استان تهران است و بعد از 1388 متعلق به استان البرز می باشد . اگر ما استان شهر کرج را از تهران به البرز تغییر دهیم آن گاه تمام تراکنش های شهر کرج متعلق به استان البرز می شود که کاملا غلط است ، به عنوان مثال فروش استان البرز در سال 86 را x نشان می دهد در صورتی که آن موقع استان البرز وجود نداشته است . همچنین اگر همواره کرج را جزو استان تهران در نظر بگیریم کاملا غلط است و باعث می شود که در بررسی و تحلیل عملکرد استان های البرز و تهران کاملا به بیراهه برویم . در واقع باید از مکانیزمی استفاده کنیم که این تغییرات را به گونه ای ثبت کند که ماهیت داده حفظ شود ، به عنوان مثال فروش قیل 88 شهر کرج را به استان تهران و بعد از 1388 را به استان کرج نسبت دهد . در این مورد از مکانیزمی به نام SCD استفاده میکنیم که در مباحث مربوط به SSIS توضیح داده خواهد شد .
4 – Time Variant (متغیر با زمان)
تمام داده های ثبت شده در Data Warehouse در طی زمان و به همراه کلید زمان ثبت می شوند ، بنابراین زمان یکی از اصلی ترین موضوعات تحلیل هر کسب و کاری است .
همین که دیتا در Data Warehouse تجمیع می شود می توان از آن برای تحلیل و ایجاد داشبورد استفاده کرد اما معمولا این کار در این لایه انجام نمی شود . معمولا بعد از تجمیع داده در Data Warehouse از یک لایه به نام Data Modeling استفاده می کنیم و در این لایه به تحلیل و پردازش اطلاعات می پردازیم .
Data Modeling چیست
Data Modeling در اصل روشی برای مدل سازی داده است . در واقع روشی برای ثبت و ذخیره و بازیابی اطلاعات و مرتبط نمودن عناصر موجود در داده می باشد . خود روش Relational یک روش Data Modeling است اما در پروژه های هوش تجاری منظور ما از Data Modeling انتخاب روشی مناسب برای تحلیل و پردازش است .
توجه داشته باشید که به اشیای موجود در لایه OLAP ، Data Model نام دارند . در مقاله های بعدی به طور کامل در مورد Data Model و OLAP توضیح خواهیم داد .
به دو دلیل بسیار مهم از لایه Data Modeling استفاده میکنیم :
پس از ایجاد لایه OLAP و اتمام تحلیل نوبت به لایه Presentation می رسد . در این لایه خروجی تحلیل ها را به داشبورد و گزارش و … تبدیل می کنیم تا کاربر بتواند از آن استفاده کند .
مایکروسافت ابزار های متعدد و قدرتمندی را در زمینه پیاده سازی هوش تجاری دارد که به شرح زیر است :