تحليل البيانات الاستكشافية، وهو مجموعة من الأساليب الإحصائية متعددة الأبعاد والوصفية، تساعدنا في فحص البيانات وتدقيقها لتكون أكثر دقة، ومن ثمة إعادة تشكيلها وتخزينها لنحصل في النهاية على معلومات يمكن على أساسها اتخاذ القرارات.

وهي مجموعة فرعية ممّا يسمّى عمومًا بالإحصاءات متعددة المتغيرات، تساعد طرق معينة- في معظمها هندسيًا- على إبراز العلاقات التي قد توجد بين البيانات المختلفة واستخلاص المعلومات الإحصائية منها، مما يجعل من الممكن وصف المعلومات الرئيسية الواردة في هذه البيانات بشكل أكثر إيجازًا، إذ يتيح تحليل المعطيات معالجة كمية كبيرة جدًا من البيانات وتحديد الجوانب الأكثر إثارة للاهتمام في هيكلها.

ويعود نجاح هذا التخصص في السنوات الأخيرة، إلى حد كبير إلى التمثيلات الرسومية المتقدمة، فيمكن لهذه الرسوم البيانية أن تسلط الضوء على العلاقات التي يصعب التقاطها عن طريق تحليل البيانات المباشر، ولكن قبل كل شيء، لا ترتبط هذه التمثيلات برأي مسبق حول قوانين الظواهر التي تم تحليلها، على عكس طرق الإحصاء الكلاسيكية. وقد بدأت الأسس الرياضية لتحليل المعطيات في التطور في مطلع القرن العشرين، لكن أجهزة الكمبيوتر هي التي جعلت هذا النظام عمليًا، وجعلت منه مستخدمًا على نطاق واسع، من أجل ذلك يرتبط تحليل المعطيات بالرياضيات وعلوم الكمبيوتر ارتباطًا وثيقًا.

وبناءً على ما سبق تقديمه يتضّح أنّ تحليل المعطيات عبارة عن مجموعة من التقنيات الوصفية، الأداة الرياضية الرئيسية فيها هي جبر المصفوفات، والتي يتم التعبير عنها دون افتراض نموذج احتمالي مسبق. ولتحليل المعطيات العديد من الطرائق التي تختلف باختلاف المجال المستخدمة فيه، إذ يمكننا استخدام تحليل المعطيات في العلوم الطبيعية والعلوم الاجتماعية والمالية.