แนวคิดของ ข้อมูลขนาดใหญ่ เป็นของภาษาอังกฤษและไม่ได้เป็นส่วนหนึ่งของพจนานุกรมที่จัดทำโดยRoyal Spanish Academy (RAE) แนวคิดนี้หมายถึงการจัดเก็บและการจัดการข้อมูลจำนวนมาก
ประเด็นที่เกี่ยวข้องกับ ข้อมูลขนาดใหญ่ได้ รับการศึกษาและจัดการโดยเทคโนโลยีสารสนเทศและการสื่อสาร (ICT) ชุดวิทยาศาสตร์และสาขาวิชานี้มีโซลูชันสำหรับการรวบรวมจัดเก็บค้นหาวิเคราะห์และแสดงชุดข้อมูลจำนวนมาก
ข้อมูลขนาดใหญ่ เป็นสิ่งสำคัญเมื่อ มัน มาถึงการพัฒนารูปแบบและสถิติการเปรียบเทียบการพยากรณ์และให้รายงานที่ถูกต้องมักจะต้องทำงานที่มีจำนวนมากของข้อมูล - มิฉะนั้นผลที่ไม่ถูกต้องหรือความถูกต้อง
ไม่มีจำนวนที่แม่นยำของการเป็นข้อมูลที่จะพูดคุยเกี่ยวกับข้อมูลขนาดใหญ่ ข้อ จำกัด ที่ได้รับการจัดการมักจะหมุนรอบเทราไบต์, เพตาไบต์หรือzettabyesการทำงานกับข้อมูลจำนวนดังกล่าวจำเป็นต้องใช้ทรัพยากรทางเทคโนโลยีขั้นสูง
ซึ่งหมายความว่าผู้ใช้ที่มีคอมพิวเตอร์ที่บ้านแทบจะไม่สามารถทำงานกับ ข้อมูลขนาดใหญ่ได้ เนื่องจากคอมพิวเตอร์เหล่านี้ไม่ได้เตรียมพร้อมที่จะจัดการและจัดเก็บข้อมูลจำนวนมาก
อย่างไรก็ตาม ข้อมูลขนาดใหญ่ จะถูกทิ้งลงในฐานข้อมูลประเภทต่างๆ เป็นไปได้ที่จะจัดการข้อมูลที่มีโครงสร้าง (ซึ่งกำหนดรูปแบบไว้แล้ว) ข้อมูลกึ่งโครงสร้าง (ไม่ จำกัด เฉพาะช่องเฉพาะ แต่มีเครื่องหมายสำหรับความแตกต่างขององค์ประกอบ) และข้อมูลที่ไม่มีโครงสร้าง (ไม่มีรูปแบบเฉพาะ) ในทางกลับกันข้อมูลสามารถจับและดูได้โดยใช้เครื่องมือคอมพิวเตอร์ต่างๆตามความต้องการ
ความสำคัญของแนวคิดนี้คือไม่แน่นอนสำหรับหลาย บริษัท เนื่องจากจะช่วยให้พวกเขาที่จะได้คำตอบไปหลายพันคำถามที่สำคัญสำหรับการดำเนินงานที่ถูกต้องที่ความเร็วที่จะเป็นไปไม่ได้ผ่านการทำงานของมนุษย์ด้วยความคล่องตัวที่นำเสนอโดยระบบการจัดการข้อมูลและการสืบค้นข้อมูลที่แตกต่างกันทำให้ได้ผลลัพธ์ที่ "ปรับแต่ง" ที่เข้าใจง่าย
คำสำคัญอย่างหนึ่งในชีวิตสมัยใหม่คือ " แนวโน้ม ": ความโน้มเอียงของมนุษย์นี้ที่จะทำกิจกรรมบางอย่างหรือบริโภคผลิตภัณฑ์และบริการบางอย่างทำให้บาง บริษัท กำหนดข้อเสนอให้เหมาะกับรสนิยมและความต้องการของตนและทำเช่นนั้น การสะสมข้อมูลทางสถิติจำนวนมากเป็นสิ่งสำคัญ
พูดง่ายๆก็คือการใช้ ข้อมูลขนาดใหญ่ เป็นการสิ้นสุดความสุขสำหรับทุกคน: บริษัท ต่างๆดำเนินธุรกิจที่อุดมสมบูรณ์มากขึ้นเพิ่มประสิทธิภาพในการดำเนินงานและปริมาณผลกำไรในขณะที่ลูกค้าได้รับผลิตภัณฑ์และบริการที่ต้องการ และทั้งหมดนี้ส่งผลดีต่อตลาด
ควรกล่าวว่าการจัดเก็บข้อมูลไม่ได้ดำเนินการในสถานที่ของ บริษัท เองเสมอไป บริการมี ข้อมูลขนาดใหญ่ ในระบบคลาวด์ด้วยราคาที่แข่งขันได้ซึ่งสามารถแสดงถึงการประหยัดในการใช้งานและการบำรุงรักษาอย่างมีนัยสำคัญและหลีกเลี่ยงปัญหาทั่วไปที่เกี่ยวข้องกับการขยายหน่วยความจำ
เพื่อทำความเข้าใจทั้งหมดนี้ลองนึกถึงตัวอย่างง่ายๆ: บุคคลหนึ่งต้องการสร้างธุรกิจ แต่ไม่มีความคิดที่ชัดเจนดังนั้นเขาจึงมองไปที่หน้าต่างเพื่อสังเกตเพื่อนบ้านของเขาเพื่อหาแรงบันดาลใจ ตลอดทั้งวันที่เขาได้ยินหลาย ๆ คนบ่นเกี่ยวกับการขาดของร้านขายของชำในพื้นที่และบนพื้นฐานของข้อมูลนี้ตัดสินใจที่จะเปิดให้บริการอย่างใดอย่างหนึ่งของตัวเองเพื่อตอบสนองความนี้จำเป็นที่จะต้องการวิเคราะห์ ข้อมูลขนาดใหญ่ ช่วยให้สามารถประมวลผล "เรื่องราว" แบบนี้ได้หลายล้านเรื่องพร้อมกันเพื่อเปิดประตูสู่แนวคิดใหม่ ๆ ที่หลายครั้งผู้ใช้เองก็ไม่รู้ว่าจะมี