التنقيب في البيانات

عودة للموسوعة

التنقيب في البيانات

التنقيب في البيانات (الإنجليزية: Data mining) هي عملية درس محوسب ويدوي عن فهم من البيانات دون فرضيات مسبقة عما يمكن حتى تكون هذه الفهم. كما ويعهد التنقيب في البيانات على أنه عملية تحليل كمية بيانات (عادة ما تكون كمية كبيرة) لإيجاد علاقة منطقية تلخص البيانات بطريقة جديدة تكون مفهومة ومفيدة لصاحب البيانات. يطلق اسم "نماذج" models على العلاقات والبيانات الملخصة التي يتم الحصول عليها من التنقيب في البيانات. يتعامل تنقيب البيانات عادة مع بياناتقد يكون قد تم الحصول عليها بغرض غير غرض التنقيب في البيانات (مثلاً قاعدة بيانات التعاملات في مصرف ما) مما يعني حتى كيفية التنقيب في البيانات لاتؤثر مطلقاً على كيفية تجميع البيانات ذاتها. هذه هي أحد النواحي التي يختلف فيها التنقيب في البيانات عن الإحصاء، ولهذا يشار إلى عملية التنقيب في البيانات على أنها عملية إحصائية ثانوية. يشير التعريف أيضاً إلى حتى كمية البيانات تكون عادة كبيرة، أما طالما كون كمية البيانات صغيرة فيفضل استخدام الطرق الإحصائية العادية في تحليلها.

عند التعامل مع حجم كبير من البيانات تظهر مسائل جديدة مثل كيفية تحديد النقاط المميزة في البيانات، وكيفية تحليل البيانات في فترة زمنية معقولة وكيفية قرار ما إذا كانت أي علاقة ظاهرية تعكس حقيقة في طبيعة البيانات. عادة يتم التنقيب في بيانات تكون جزءاً من تام البيانات حيثقد يكون الغرض عادة تعميم النتائج على تام البيانات (مثلاً تحليل البيانات الحالية لمستهلكي منتج ما بغرض تسقط طلبات المستهلكين المستقبلية). من أحد أهداف تنقيب البيانات أيضاً هواختزال كميات البيانات الكبيرة أوضغطها بحيث تعبر بشكل سهل عن تام البيانات بدون تعميم.

ويعد تنقيب في البيانات من المفهومات الجديدة في الهندسة المعلوماتية، ظهر نتيجة التطور الكبير الذي شهده استخدام قواعد المعطيات database في النصف الثاني من تسعينات القرن العشرين، وتلازم ظهوره مع الحاجة إلى مايسمى «اكتشاف الفهم» knowledge discovery.

أتاح تطور التقانات المعلوماتية إمكانات واسعة للتعامل مع مقادير كبيرة من البيانات، ووفر الوسائل اللازمة لتخزينها وتعديلها واستخراج المعلومات منها لدى المؤسسات التي تستخدم الوسائل المعلوماتية ويعتمد عملها اعتماداً كبيراً على الأنظمة المعلوماتية والبيانات مثل المصارف وشركات التأمين وغيرها.

إن النموالسريع لحاجات المؤسسات وزيادة حجوم مخازن البيانات الحديثة التي يجري تجميعها على مراحل زمنية طويلة من جهة، واختلاف طبيعة المعطيات التي يمكن تخزينها من جهة أخرى، جعل الطرق الإحصائية التقليدية قاصرة عن تحقيق جميع متطلبات تحليل المعطيات، الأمر الذي استدعى تطوير طرائق جديدة تستخدم تقانات الذكاء الصنعي في تحليل ذلك الكم الضخم من المعطيات، واستخلاص مايهم الفهم المفيدة. وأدت هذه التقانات والأدوات إلى ظهور ما سُمي اكتشاف الفهم من قاعدة البياناتknowledge discovery in databases (KDD) الذي عدّ فرعاً مستقلاً بذاته من فروع المعلوماتية. وقد عُقدت تحت شعاره عدّة مؤتمرات كان أولها عام1991، وصدرت مجلة خاصة بهذا الفهم عام 1997 تدعى Fayyad، وأجريت بحوث عدّة في مجاله والمجالات الأخرى المرتبطة به من بينها تقانات قواعد المعطيات والإحصاء والتفهم الآلي.

من الصعب إعطاء تعريف دقيق لعملية اكتشاف الفهم من قواعد المعطيات كونها عملية معقدة تحاكي عمليات الاكتشاف التي يقوم بها الجهاز العصبي لدى الإنسان، والتعريف الأكثر شيوعاً هو: «عملية مركبة تهدف إلى تحديد الأجزاء المفيدة والمفهومة والجديدة من المعطيات». غالباً ما يستخدم التعبيران «تنقيب في البيانات» و«اكتشاف الفهم» مترادفين، ومن الشائع استخدام مصطلح «تنقيب في البيانات» في مجال الصناعة، أما مصطلح «اكتشاف الفهم» فتعبير رائج في مجال الأبحاث الفهمية. وعلى أساس المنحى الفهمي فإن عملية «تنقيب في البيانات» ليست فترة واحدة من مراحل «اكتشاف الفهم». وتتألف من تحليل المعطيات، وخوارزميات الاكتشاف التي تنتج في زمن مقبول عينات خاصة من البيانات.

بحوث وتطور

العملية

Pre-processing

التحقق من صحة النتائج

An example of data produced by data dredging through a bot operated by statistician Tyler Viglen, apparently showing a close link between the best word winning a spelling bee competition and the number of people in the United States killed by venomous spiders. The similarity in trends is obviously a coincidence.

المعايير

أشهر الاستخدامات

انظر أيضا تصنيف: Applied data mining

نطقب:Cleanup-rewrite

الألعاب

الأعمال

العلوم والهندسة =

حقوق الإنسان

Spatial data mining

التحديات

التنقيب بالاستشعار

التنقيب المرئي

التنقيب موسيقي

المراقبة

نمط التنقيب

شبكة الفهم

Reliability

مخاوف الخصوصية والأخلاق

البرمجة

انظر أيضا تصنيف: Data mining and machine learning software

Free libre open-source data-mining software and applications

برمجيات وتطبيقات التنقيب التجاري

استطلاعات السوق

أنواع

هناك نوعان أساسيان للتنقيب في البيانات هما: االتنقيب الاستشرافي والتنقيب الوصفي.

التنقيب الاستشرافي ينتج عنه نموذج عن النظام الذي تصفه البيانات المستخدمة في التنقيب. أما التنقيب الوصفي فينتج عنه معلومات جديدة بناء على المعلومات الموجودة داخل البيانات المستخدمة في عملية التنقيب.

الكيفية

أهداف التنقيب

هناك ثلاثة أهداف للتنقيب في البيانات:

1) من أجل تعليل بعض الظواهر المرئية. مثال:

2) من أجل التثبت من نظرية ما. مثال: التثبت من النظرية التي تقول بأن الأسر الكبيرة تهتم بالضمان الصحي أكثر من الأسر الصغيرة عددا.

3) من أجل تحليل البيانات للحصول على علاقات جديدة وغير متسقطة. مثال: كيف من الممكن أن سيكون الانفاق العام إذا كان ملازما لعمليات خداع واسعة من قبل البطاقات الائتمانية.

وسائل التنقيب في البيانات

هناك عدة وسائل مختلفة من أجل التنقيب في البيانات. اختيار الوسيلة المناسبة يعتمد على طبيعة البيانات تحت الدراسة وعلى حجمها. يمكن اجراء عملية التنقيب في البيانات بالمقارنة مع سوق البيانات ومخزن البيانات.

بعض من هذه الوسائل هي: (يتبعها وظيفة جميع وسيلة)

- التفكير واستخلاص النتائج والقوانين من أمثلة حية Case-Based reasoning

- الكشف عن قانون Rule Discovery: البحث عن منوال معين أوعلاقة معينة في جزئية كبيرة من البيانات

- معالجة الإشارات Signal Processing: ايجاد الظواهر المتشابه مع بعضها البعض

- شبكات نووية Neural Nets: تطوير نماذج قابلة لتنبؤ النتائج. هذه النماذج تم تطويرها بناءا على أسس تم استنباطها من عقل الإنسان.

- منحنيات غير ثابتة Fractals: تصغير البيانات الكبيرة من دون ضياع المعلومات

تطبيقات التنقيب في البيانات

وسائل التنقيب في البيانات تُستعمل وبنجاح في الكثير من التطبيقات الحقيقة حول العالم.

التطبيقات التالية تضم بعضا من الأمثلة: (يتبعها مثال لكل تطبيق)

- كتابة تقرير مختصر عن فئة معينة Profiling Populations: تطوير وإنشاء تقارير موجزة عن الزبائن المهمين وعن بطاقات الائتمان.

- تحليل النزعة التجارية Analysis of Business Trend: ايجاد الأسواق ذات قدرات النموالقوية أوالضعيفة.

- الترويج لفئة معينة Target Marketing: ايجاد الزبائن من أجل منح التخفيضات لهم لسبب معين.

- تحليل الاستعمال Usage Analysis: ايجاد منوال معين لاستعمال الخدمات والسلع

- فعالية الحملة Campaign Effectiveness: مقارنة استراتيجيات الحملات مع بعضها البعض من أجل ايجاد أكثرها فعالية وتأثيرا.

- جاذبية السلعة: ايجاد السلع التي تباع مع بعضها البعض.

تطبيقات التنقيب في البيانات بدأت تنموبصورة كبيرة للأسباب التالية:

1) كمية البيانات الموجودة في مخزن البيانات وسوق البيانات تنموبصورة أسية (exponential).

ومن أجل ذلك، فإن المستخدم يحتاج إلى أدوات متطورة من مثل التنقيب في البيانات من اجل استخلاص الفائدة والفهم من هذه البيانات.

2) الكثير من أدوات التنقيب عن البيانات بدأت تظهر مؤخرا، وكل أداة أفضل من الأخرى.

3) المنافسة الشديدة الموجودة في السوق تدفع الشركات إلى الاستفادة القصوى من البيانات التي بيدها. عمليات التنقيب في البيانات تعمل ذلك تماما.

التنقيب في البيانات وأدوات الاستعلام

ثمة فروق واضحة بين تحري البيانات وطرائق الاستعلام ولغات الاستعلام الشائعة التي توفرها معظم نظم إدارة قواعد البيانات، مثل لغة SQL. ففي حين صُممت لغات الاستعلام بهدف تقديم وسائل تمكن مستخدمها من تحديد البيانات التي يود استخراجها من قاعدة ما، واختبار الفرضيات التي وضعها بناءً على البيانات أوالقيم المُستخرجة، صممت أدوات التنقيب في البيانات لتضع الفرضيات وتختبرها وتستنتج منها معلومات جديدة. ولتوضيح هذه الفكرة يمكن الموازنة بين هذين المنحيين في المثال الآتي: ترغب إحدى شركات تصنيع الحواسيب فهم معدلات بيع منتجاتها والوسائل الكفيلة بتحسين مردودها. فتبدأ بدراسة جميع منتج من منتجاتها لتحديد معدل البيع في بعض مناطق العالم وتوازن بين هذه المعدلات لفهم مدى قبول المنتج في تلك المناطق. ولتحقيق ذلك يمكن استعمال إحدى لغات الاستعلام مثل SQL، ثم تدرس العلاقة بين متوسط ولج ا لفرد في جميع دولة وعدد المنتجات التي تشتريها تلك الدولة سنوياً إلى غير ذلك، وفي جميع مرة هناك فرضية يجري إثباتها أونفيها. أما تقانات التنقيب في البيانات فإنها تعنى بالإجابة على السؤال الأعم من هذه الأسئلة الفرعية مثل «هل لاقى منتج ما نجاحاً كافياً، وماهي العوائق التي تحول دون الحصول على النجاح المطلوب، وما هي طرق تذليل تلك العقبات؟». لا تتطلب أداة التحري في هذه الحالة أي فرضيات، إنما تقوم بعملية الفرز والتصنيف والتحليل لاكتشاف العلاقات والمعلومات المخفية التي لا يمكن ملاحظتها دوماً.

وعموماً يمكن القول إنه طالما فهم المطلوب تماماً، يمكن استعمال لغات الاستفسار مثل SQL، أما إذا كان ما يريده المستخدم غير واضح، ولديه فرضيات أومعايير، فلا بد من اللجوء إلى تقانات تنقيب في البيانات التي صار لها أهمية كبيرة لغموض المطلوب في أكثر الحالات.

التقانات المستخدمة في تنقيب في البيانات

ثمة طيف واسع من التقانات المستخدمة في تنقيب في البيانات يتميز جميع منها بخصائص فريدة لاتوفرها التقانات الأخرى، ولذلك فإن اختيار تقانة التعهد الملائمة لحالة معينة ليس بالأمر السهل. ويمكن حصر أبرز هذه التقانات بما يلي:

ـ أدوات الاستعلام query tools ومنها لغة SQL وغيرها. وهي المستوى الأولى في عملية التنقيب في البيانات التي تستخدم أدوات استعلام تقليدية لفهم بنية المعطيات الأساسية بتطبيق خوارزميات تحليل معقدة.

ـ التقنيات الإحصائية statistical techniques.

ـ الإظهار visualization وهي طريقة مفيدة في استخلاص عينات من مجموعة البيانات، تطبق في بداية عملية تحري المعطيات، لأنها تعطي فكرة جيدة حول كفاية البيانات والعينات التي يمكن استخلاصها منها.

ـ أشجار القرار decision trees وهي تقانة مفيدة في تصنيف البيانات وفقاً لمجموعة من الخواص المتدرجة التي تشكل شجرة القرار.

ـ القواعد المترابطة association rules.

ـ الشبكات العصبونية neural networks التي تقوم على محاكاة الدماغ البشري وكيفية التفهم والتفهم الذاتي، ومن ثمّ تحول عملية التنقيب في البيانات إلى قيم يمكن إرسالها إلى مداخل عقد الشبكة.

ـ الخوارزميات الجينية genetic algorithms التي اشتقت من فهم البيولوجيا والوراثة، وهي نوع متطور من استراتيجيات التفهم، تقوم على نظرية التطور، ويجري تحويل معضلة التنقيب في البيانات إلى مجموعة من سلاسل صبغيات.

فإذا توصلت إحدى هذه التقنيات إلى إيجاد شكل مناسب، فبإمكان بقية التقنيات إيجاد هذا الشكل وتترجم المشكلة إلى تقنية التفهم learning technique ومن ثمّ يقوم مختصّ بإيجاد التمثيل الهندسي للشكل الناتج.

أمثلة عن أهمية تطبيق تقانات التنقيب في البيانات

يمكن بيان أهمية تطبيق تقانات تحري البيانات في مثال سهل يعرض وضع شركة توزيع، تتلقى طلبات شراء من المواطنين، تُدخل هذه الطلبات في نظام معلوماتي قبل إرسال المواد والبضائع التي تتضمنها هذه الطلبات إلى الزبائن. بعد العمل مدة طويلة بهذه الطريقة، يفترض أن يتوافر لدى هذه الشركة قاعدة معطيات مهمة تحتوي على المعلومات التي تتضمنها طلبات الزبائن في تلك الفترة، وسوف تكون هذه القاعدة مصدراً مهماً للمعلومات، تستفيد منه الشركة في اتخاذ القرارات المناسبة لعملها، ووضع خططها المستقبلية وتحديد مجموعات الزبائن التي تتعامل معها، ومن ثمّ تصنيفها وفقاً للمناطق السكنية، أوالفئات العمرية، أوالمنتجات المطلوبة، أوغيرها من المعايير البسيطة أوالمركبة. كما تستطيع الشركة دراسة وسائل الترويج والنادىية التي تستخدمها، ومردود هذه الوسائل. فقد تكتشف الشركة حتى عدد زبائنها الذين تعهدوا على منتجاتها من الرسائل البريدية التي أوفدتها إلى سكان منطقة سكنية معينة لم يتجاوز نسبة 4٪، وأن الربح الذي حققته من بيع منتجاتها لهذه الشريحة من الزبائن لا يغطي ما أنفقته في إرسال هذه الرسائل، ومن ثمّ لابد من إيجاد وسائل ترويج أكثر ملاءمة مثل الإعلان عن تخفيضات في أسعار بعض المنتجات أوتوفير طرق تسديد تناسب مستوى دخلهم. كما يمكن تطبيق تقانات أكثر تعقيداً مثل الشبكات العصبونية لمحاكاة عملية إرسال الإعلانات بالبريد وتجاوب الزبائن مع هذه الرسائل. تتفهم الشركة من المعلومات المسجلة حول ما جرى في الماضي ما يرشدها بعد ذلك إلى اختيار العنوانات التي يمكن حتى تتجاوب مع هذه الطريقة في الإعلان.

كذلك يمكن الانتنطق إلى مستوى أكثر تعقيداً من دراسة الزبائن والعلاقة التي يمكن حتى تكون بين مجموعات الزبائن ومجموعات المنتجات التي تسوقها الشركة؛ فالزبائن الذين يشترون اليوم ملابس لأطفالهم الرضع، قد يشترون بعد عشر سنوات الألعاب الإلكترونية لهؤلاء الأطفال.

يتبين من هذا المثال أهمية فهم هذه الأنواع من القواعد وتطبيقها لإيجاد فرص تجارية أفضل، وفهم مدى فعالية طرق الترويج التي تطبقها وتدقيقها، ومقارنة هذه الوسائل وتحديد ما يناسب شريحة معينة من الزبائن.

لا يقتصر التنقيب في البيانات على التطبيقات من النوع السابق، وإنما يضم طيفاً واسعاً من النشاطات، فمثل هذا التقانات تفيد، إذا ما طُبقت على قواعد البيانات التي تحوي معطيات عن المشافي والسقمى الذين يدخلون، والأدوية التي يتعاطونها وطرق العلاج المستخدمة، ومدى استجابة الأمراض لها، والتوزع السكاني للسقمى، وأحوال الطقس في هذه المناطق السكنية، والأعمال التي يمارسها سكانها، ومستواهم التعليمي في فهم الأمراض التي تصيب فئة معينة منهم، واكتشاف الأوبئة التي تصيب الناس في أوقات معينة واتخاذ الاحتياطات اللازمة لها، وغير ذلك من المعلومات؛ تفيد في اتخاذ قرارات تتعلق بتحسين مستوى الخدمات الطبية التي تقدمها هذه المشافي.

تكامل أنظمة دعم القرار مع عملية التنقيب في البيانات

تعد عملية تنقيب في أحد أشكال أنظمة دعم القرار، فهي تستخدم للاستعلام ولاستخلاص الفهم من مخازن البيانات المتوافرة. تتطلب عملية استكشاف الفهم ست مراحل:

ـ اختيار البيانات data selection ويجري في هذه الفترة تجميع المعلومات المراد معالجتها من مخازن البيانات المتنوعة ووضعها في مخزن للبيانات.

ـ التصفية cleaning وتتضمن إلغاء الإنضمامات المتكررة، وتسليم أخطاء كتابة سلاسل المحارف، وإضافة المعلومات الناسيرة وغيرها.

ـ الإغناء enrichment.

ـ الترميز coding إذ يجري استخدام ترميز وتصنيف موحد للبيانات ذات الدلالة المشهجرة والمستوردة من بنوك المعطيات المعنية.

ـ تحري االبيانات.

ـ بناء التقارير reporting.

وتعد الفترة الخامسة (فترة التنقيب في البيانات)فترة الاكتشاف الحقيقية.

ويستطيع المنقب عن البيانات data miner الرجوع إلى الخلف خطوة واحدة أوأكثر، فقد يجد حينقد يكون في فترة الترميز أوفترة التحري، بأن فترة التصفية غير كاملة، أوقد يكتشف معطيات جديدة تغني مجموعات البيانات الموجودة مسبقاً. ومن المحال وصف تام تلوث البيانات data pollution الذي يمكن تسقط وجوده في قاعدة البيانات سلفاً، إذ لا يمكن اكتشافه إلا في فترة التحري فقط.

التطبيقات العملية للتنقيب في البيانات والصعوبات الناتجة

تجاوزت تقانات التنقيب في البيانات طور الاختبار ودخلت حيز الاستخدام العملي في الدول المتقدمة. وقد كانت الشركات الكبيرة مثل شركات الهاتف والمصارف أول من طبق تقانات اكتشاف الفهم في قواعد البيانات لتحليل ملفات زبائنها. بعد ذلك اتسع مجال استخدام هذه التقانات ليضم طيفاً واسعاً من النشاطات مثل شركات التأمين ومراكز دراسة أحوال الطقس والمؤسسات التعليمية والطبية وغيرها.

ومن الملاحظ حتى 80٪ من أعمال اكتشاف الفهم في قواعد المعطيات تقوم على تحضير البيانات، أما 20٪ المتبقية فتقوم على التحري فيها.

وتعد فترة تحضير البيانات التي تستخدم الإجراءات والأساليب التقليدية من قواعد البيانات لإدخالها وترميزها، الفترة الأكثر أهمية ضمن مراحل اكتشاف الفهم. فمن دون البيانات سليمة يبقى هناك نقص ما يجب البحث عنه.

ولما كان اكتشاف الفهم والتنقيب في البيانات محورين جديدين من محاور المعلوماتية التي تتعامل مع معطيات الصناعة المتنامية بوتيرة عالية، مازال هذا الفهم يقابل الكثير من المصاعب منها:

ـ عملية اكتشاف الفهم: هناك حاجة إلى فهم أفضل لعملية اكتشاف الفهم، إذ يجب تحديد المراحل المتنوعة في هذه العملية، والعلاقات بين مختلف المراحل في أثنائها، كذلك ينبغي وضع مرشد يساعد محللي الأعمال ومهندسي التنقيب في البيانات في إنجاز مشاريع اكتشاف الفهم.

ـ التغيرات والتبدلات في البيانات: إذا تبدل البيانات باستمرار، وحفظها في قواعد المعطيات يجعل من عملية اكتشاف الفهم الشغل الشاغل لأولئك الذين يسعون إلى إيجاد تقانات جديدة للتعامل مع تلك الأشكال المتغيرة، مما يضطرهم إلى إيجاد وسائل إضافية للتأكد من حتى عملية اكتشاف الفهم المستخدمة مازالت فعّالة لدى الانتنطق إلى صيغ جديدة للمعطيات، وفي بعض الأحيان تعديل نموذج التحري المستخدم ليتناسب معها.

ـ المحاور المتعددة الاستراتيجيات: أحياناًقد يكون استخدام نوع واحد من خوارزميات التنقيب في البيانات غير كافٍ للإجابة عن سؤال معقد نوعاً ما. ولذلك تظهر الحاجة إلى توظيف عدة استراتيجيات قائمة على استخدام مجموعة من التقانات للإجابة عن سؤال واحد.

ـ تدرج عملية اكتشاف الفهم والتنقيب في البيانات:

يزداد كمّ البيانات بسرعة، وتتطلب قواعد البيانات اليوم استخدام طرائق فعّالة للوصول إلى المعطيات. وهي أيضاً مجبرة على استخدام خوارزميات التنقيب في البيانات، التي يجب تعديلها بما يتناسب مع هذا الكمّ المتزايد من البيانات. كذلك ينبغي توظيف تقانات لتخليص المعطيات قبل القيام بعملية التنقيب فيها ضمن عملية اكتشاف الفهم.

انظر أيضاً

الطرق

  • Anomaly / outlier / change detection
  • Association rule learning
  • Classification
  • Cluster analysis
  • Decision trees
  • Factor analysis
  • Neural Networks
  • Regression analysis
  • Structured data analysis
  • Sequence mining
  • Text mining

مجالات التطبيقات

  • Analytics
  • Bioinformatics
  • Business intelligence
  • Data analysis
  • Data warehouse
  • Decision support system
  • Drug Discovery
  • Exploratory data analysis
  • Predictive analytics
  • Web mining

أمثلة التطبيقات

انظر أيضا تصنيف: Applied data mining
  • Customer analytics
  • Data mining in agriculture
  • National Security Agency
  • Police-enforced ANPR in the UK
  • Quantitative structure–activity relationship
  • Data mining in meteorology
  • Educational data mining
  • Surveillance / Mass surveillance (e.g., Stellar wind)

مواضيع ذات صلة

Data mining is about analyzing data; for information about extracting information out of data, see:

  • Information extraction
  • Information integration
  • Web scraping
  • Named-entity recognition
  • Data integration
  • Data transformation
  • Profiling practices

المصادر

  1. ^ مادلين عبود. "تحري المعطيات". الموسوعة العربية.

قراءات أخرى

نطقب:Copy edit-section

  • Cabena, Peter, Pablo Hadjnian, Rolf Stadler, Jaap Verhees and Alessandro Zanasi (1997). Discovering Data Mining: From Concept to Implementation. Prentice Hall, ISBN 0-13-743980-6.
  • Feldman, Ronen and James Sanger. The Text Mining Handbook. Cambridge University Press, ISBN 978-0-521-83657-9.
  • Guo, Yike and Robert Grossman, editors (1999). High Performance Data Mining: Scaling Algorithms, Applications and Systems. Kluwer Academic Publishers.
  • Hastie, Trevor, Robert Tibshirani and Jerome Friedman (2001). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer, ISBN 0-387-95284-5.
  • Liu, Bing (2007). Web Data Mining: Exploring Hyperlinks, Contents and Usage Data. Springer, ISBN 3-540-37881-2.
  • Murphy, Chris (May 16, 2011). "Is Data Mining Free Speech?". InformationWeek. UMB: 12.
  • Nisbet, Robert, John Elder, Gary Miner (2009). Handbook of Statistical Analysis & Data Mining Applications. Academic Press/Elsevier. ISBN 9780123747655
  • Poncelet, Pascal, Florent Masseglia and Maguelonne Teisseire, editors (October 2007). "Data Mining Patterns: New Methods and Applications", Information Science Reference. ISBN 978-1-59904-162-9.
  • Pang-Ning Tan, Michael Steinbach and Vipin Kumar (2005). Introduction to Data Mining. ISBN 0-321-32136-7
  • Sergios Theodoridis, Konstantinos Koutroumbas (2009). Pattern Recognition, 4th Edition. Academic Press. ISBN 978-1-59749-272-0.
  • Weiss and Indurkhya. Predictive Data Mining. Morgan Kaufmann.
  • Ian H. Witten; Eibe Frank; Mark A. Hall (30 January 2011). Data Mining: Practical Machine Learning Tools and Techniques (3 ed.). Elsevier. ISBN . (See also Free Weka software.)
  • Ye, N. (2003). The Handbook of Data Mining. Mahwah, New Jersey: Lawrence Erlbaum.

وصلات خارجية

  • Data Mining Software at the Open Directory Project

نطقب:Data warehouse


[[Category:| ]]

تاريخ النشر: 2020-06-04 18:12:16
التصنيفات: صفحات بها أخطاء في البرنامج النصي, Commons category link is locally defined, تحليل البيانات, Formal sciences, معلوماتية, حاسوب

مقالات أخرى من الموسوعة

سحابة الكلمات المفتاحية، مما يبحث عنه الزوار في كشاف:

آخر الأخبار حول العالم

فايزر تعتزم بيع نحو 500 دواء ولقاح بسعر التكلفة للدول الأكثر فقرًا

المصدر: موقع الدستور - مصر التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:50
مستوى الصحة: 50% الأهمية: 61%

نابولي يكشف موقفه: أوناحي لاعب جيد ولا نفكر في الميركاتو

المصدر: تيل كيل عربي - المغرب التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:37
مستوى الصحة: 45% الأهمية: 65%

أول تعليق من التعليم على تأخير امتحان الشهادة الإعدادية فى بلبيس

المصدر: موقع الدستور - مصر التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:37
مستوى الصحة: 48% الأهمية: 53%

المشدد 10 سنوات لزوج بتهمة تعذيب زوجته في الغربية

المصدر: موقع الدستور - مصر التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:34
مستوى الصحة: 45% الأهمية: 53%

تأجيل محاكمة المتهمين بقتل الصيدلى ولاء زايد بحلوان

المصدر: موقع الدستور - مصر التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:33
مستوى الصحة: 46% الأهمية: 57%

أحمد خالد صالح يبدأ تصوير دوره في مسلسل «تحت الوصاية»

المصدر: موقع الدستور - مصر التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:42
مستوى الصحة: 48% الأهمية: 53%

وفاة "أكبر معمّرة في العالم" عن عمر 118 عاما

المصدر: تيل كيل عربي - المغرب التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:38
مستوى الصحة: 53% الأهمية: 56%

بيراميدز يحسم مصير صفقة انتقال عبدالله السعيد للزمالك

المصدر: موقع الدستور - مصر التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:23
مستوى الصحة: 54% الأهمية: 53%

تقرير: ريال مدريد اجتمع مع مبابي من جديد بعد كأس العالم

المصدر: موقع الدستور - مصر التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:25
مستوى الصحة: 53% الأهمية: 52%

تقرير يوناني: الربط الكهربائي بين القاهرة وأثينا يحقق منافع مشتركة

المصدر: موقع الدستور - مصر التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:49
مستوى الصحة: 52% الأهمية: 63%

آيت الطالب: إحداث الهيئة العليا للصحة سيضمن استمرارية عمل الدولة

المصدر: تيل كيل عربي - المغرب التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:43
مستوى الصحة: 45% الأهمية: 58%

أخبار الظهيرة| مقتل 16 بينهم وزير بتحطم مروحية بأوكرانيا

المصدر: موقع الدستور - مصر التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:38
مستوى الصحة: 57% الأهمية: 54%

رفع 78 سيارة ودراجة نارية مخالفة بالشوارع

المصدر: موقع الدستور - مصر التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:35
مستوى الصحة: 56% الأهمية: 62%

محافظ دمياط تفتتح كورنيش ومدخل كفر البطيخ

المصدر: موقع الدستور - مصر التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:30
مستوى الصحة: 45% الأهمية: 68%

وفاة والدة الفنان أحمد هارون.. وتشييع الجنازة من مسجد السيدة نفيسة

المصدر: موقع الدستور - مصر التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:42
مستوى الصحة: 52% الأهمية: 58%

منذ مطلع الستينيات لم يسجّل.. عدد سكان الصين ينخفض

المصدر: تيل كيل عربي - المغرب التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:52
مستوى الصحة: 48% الأهمية: 61%

أستراليا تستبدل أسطولها من مروحيات «تايبان» الفرنسية بأخرى أمريكية

المصدر: موقع الدستور - مصر التصنيف: سياسة
تاريخ الخبر: 2023-01-18 12:21:49
مستوى الصحة: 59% الأهمية: 66%

تحميل تطبيق المنصة العربية