Hồ dữ liệu là gì? – Giới thiệu về Hồ dữ liệu và Phân tích – AWS

<div data-eb-slot="what-is-header" data-eb-slot-meta="{'version':'1.0','slotId':'what-is-header','experienceId':'93f2c10b-57a0-4aac-a291-b4b33afe10b1','allowBlank':false,'hasAltExp':false,'isRTR':false,'filters':{'limit':1,'query':'id \u003d \'what-is-a-data-lake\''}}"> <div data-eb-tpl-n="awsm-what-is/what-is-header" data-eb-tpl-v="1.0.1" data-eb-ce="" data-eb-c-scope="what-is-header" data-eb-d-scope="DIRECTORIES" data-eb-locale="vi-VN" data-eb-99e83dc4="" data-eb-ssr-ce="" data-eb-tpl-ns="awsmWhatIs"> .eb-breadcrumbs-link{position:relative;margin-right:6px;padding-left:11px;color:#539fe5}[data-eb-99e83dc4] .eb-what-is-header .eb-breadcrumbs-link:hover{color:#89bdee}[data-eb-99e83dc4] .eb-what-is-header .eb-breadcrumbs-link:focus{text-decoration:none;outline-offset:2px;outline:#0972d3 solid 2px;border-radius:2px}[data-eb-99e83dc4] .eb-what-is-header .eb-breadcrumbs-link:before{position:absolute;top:-2px;left:0;color:#d1d5db;content:"/"}[data-eb-99e83dc4] .eb-what-is-header .eb-breadcrumbs-item{margin-bottom:0;display:inline-block}[data-eb-99e83dc4] .eb-what-is-header .eb-breadcrumbs-item:first-of-type .eb-breadcrumbs-link{padding-left:0}[data-eb-99e83dc4] .eb-what-is-header .eb-breadcrumbs-item:first-of-type .eb-breadcrumbs-link:before{content:none}</style> <script type="application/json">{"data":{"items":[{"fields":{"primaryCTAText":"Tạo tài khoản AWS","description":"<p>Hồ dữ liệu là kho tập trung cho phép bạn lưu trữ toàn bộ dữ liệu có cấu trúc và không có cấu trúc ở bất kỳ quy mô nào. Bạn có thể lưu nguyên trạng dữ liệu mà không phải sắp xếp dữ liệu thành cấu trúc trước cũng như chạy nhiều loại phân tích khác nhau - từ bảng thông tin và hình ảnh trực quan đến xử lý dữ liệu lớn, phân tích theo thời gian thực và máy học để hỗ trợ đưa ra quyết định sáng suốt hơn.</p>","sortDate":"2023-10-24","headlineUrl":"","id":"faq-hub#what-is-a-data-lake","category":"Phân tích","primaryCTA":"","headline":"Hồ dữ liệu là gì?"},"metadata":{"tags":[{"id":"GLOBAL#tech-category#analytics","name":"Phân tích","namespaceId":"GLOBAL#tech-category","description":"Phân tích","metadata":{}}]}}]},"metadata":{"auth":{},"testAttributes":{}},"context":{"page":{"pageUrl":""},"environment":{"stage":"prod","region":"us-east-1"},"sdkVersion":"1.0.129"},"refMap":{"manifest.js":"289765ed09","what-is-header.js":"2e0d22c000","what-is-header.rtl.css":"ccf4035484","what-is-header.css":"ce47058367","what-is-header.css.js":"004a4704e8","what-is-header.rtl.css.js":"f687973e4f"},"settings":{"templateMappings":{"category":"category","headline":"headline","primaryCTA":"primaryCTA","primaryCTAText":"primaryCTAText","primaryBreadcrumbText":"primaryBreadcrumbText","primaryBreadcrumbURL":"primaryBreadcrumbURL"}}}</script> <div data-eb-tpl-root="" data-reactroot=""> <div class="eb-what-is-header lb-bg-left-top-cover lb-mid-pad lb-none-v-margin lb-grid" data-eb-item-id="faq-hub#what-is-a-data-lake" data-eb-tags="[{&quot;id&quot;:&quot;GLOBAL#tech-category#analytics&quot;,&quot;name&quot;:&quot;Phân tích&quot;,&quot;namespaceId&quot;:&quot;GLOBAL#tech-category&quot;,&quot;description&quot;:&quot;Phân tích&quot;,&quot;metadata&quot;:{}}]"> <script type="application/ld+json">{"@context":"","@type":"BreadcrumbList","itemListElement":[{"@type":"ListItem","position":1,"name":"Điện toán đám mây là gì?","item":""},{"@type":"ListItem","position":2,"name":"Trung tâm khái niệm về điện toán đám mây","item":""},{"@type":"ListItem","position":3,"name":"Phân tích","item":""}]}</script> <div class="lb-row lb-row-max-large lb-snap"> <div class="lb-col lb-tiny-24 lb-mid-24"> <div class="lb-txt-p-cobalt lb-rtxt"> <ul class="eb-breadcrumbs"> <li class="eb-breadcrumbs-item"><a class="eb-breadcrumbs-link" title="What is Cloud Computing?" href="">Điện toán đám mây là gì?</a></li> <li class="eb-breadcrumbs-item"><a class="eb-breadcrumbs-link" title="Cloud Computing Concepts Hub" href="">Trung tâm khái niệm về điện toán đám mây</a></li> <li class="eb-breadcrumbs-item"><a class="eb-breadcrumbs-tags <h1 class="eb-headline lb-txt-none lb-h1 lb-title">Hồ dữ liệu là gì?</h1> lb-grid"> <div class="lb-row lb-row-max-large lb-snap"> <div class="lb-col lb-tiny-24 lb-mid-24"> <div data-eb-slot="what-is-faq" data-eb-slot-meta="{'version':'1.0','slotId':'what-is-faq','experienceId':'6e591111-42de-4afc-8fa8-a8dab062f66f','allowBlank':false,'hasAltExp':false,'isRTR':false,'filters':{'limit':25,'query':'tag \u003d \'faq-collections#data-lake\''}}"> <div data-eb-tpl-n="awsm-rt/rt-faq" data-eb-tpl-v="1.0.0" data-eb-ce="" data-eb-c-scope="what-is-faq" data-eb-d-scope="DIRECTORIES" data-eb-locale="vi-VN" data-eb-73154b46="" data-eb-ssr-ce="" data-eb-tpl-ns="awsmRT" data-eb-hydrated="pending"> <style>[data-eb-73154b46] .eb-faq{display:grid;justify-content:center;grid-template-columns:100%;grid-gap:20px}@media only screen and (min-width:769px){[data-eb-73154b46] .eb-faq{grid-template-columns:250px 518px}}@media only screen and (min-width:980px){[data-eb-73154b46] .eb-faq{grid-template-columns:250px 650px}}@media only screen and (min-width:1200px){[data-eb-73154b46] .eb-faq{grid-template-columns:250px 870px}}[data-eb-73154b46] .eb-faq .eb-bg-dark{background-color:#fbfbfb}[data-eb-73154b46] .eb-faq .eb-sticky-sidebar{height:100%;display:none}@media only screen and (min-width:769px){[data-eb-73154b46] .eb-faq .eb-sticky-sidebar{display:block}}[data-eb-73154b46] .eb-faq .eb-sidebar-wrapper{position:sticky;top:130px;margin-top:30px;margin-bottom:30px}[data-eb-73154b46] .eb-faq .eb-sidebar-content{transition:opacity .2s ease-in .1s;opacity:1;padding:0 15px}[data-eb-73154b46] .eb-faq .eb-sidebar-link{font-family:AmazonEmberBold,Helvetica Neue Bold,Helvetica Neue,Helvetica,Arial,sans-serif;position:relative;color:#333;text-decoration:none;user-select:none;line-height:1.3;margin-top:15px;padding-left:30px;width:250px}[data-eb-73154b46] .eb-faq .eb-sidebar-link.eb-active{color:#0972d3}</style> <script type="application/json">{"data":{"items":[{"fields":{"faqQuestion":"Hồ dữ liệu là gì?","faqAnswer":"<p>Hồ dữ liệu là kho tập trung cho phép bạn lưu trữ toàn bộ dữ liệu có cấu trúc và không có cấu trúc ở bất kỳ quy mô nào. Bạn có thể lưu nguyên trạng dữ liệu mà không phải sắp xếp dữ liệu thành cấu trúc trước cũng như chạy nhiều loại phân tích khác nhau - từ bảng thông tin và hình ảnh trực quan đến xử lý dữ liệu lớn, phân tích theo thời gian thực và máy học để hỗ trợ đưa ra quyết định sáng suốt hơn.</p>","id":"seo-faq-pairs#what-is-a-data-lake","customSort":"1"},"metadata":{"tags":[{"id":"seo-faq-pairs#faq-collections#data-lake","name":"data-lake","namespaceId":"seo-faq-pairs#faq-collections","description":"<p>data-lake</p>","metadata":{}}]}},{"fields":{"faqQuestion":"Vì sao bạn lại cần có kho dữ liệu?","faqAnswer":"<p>Các tổ chức thành công trong việc tạo giá trị kinh doanh từ dữ liệu của mình có kết quả tốt hơn đáng kể so với các tổ chức cùng loại khác. Một <a href=\"\">cuộc khảo sát của 451 Research</a> cho thấy hơn một nửa số doanh nghiệp được khảo sát hiện đã triển khai hồ dữ liệu, còn 22% doanh nghiệp khác có kế hoạch xây dựng hồ dữ liệu trong vòng 36 tháng tới. Các công ty triển khai kiến trúc dữ liệu hiện đại, bao gồm hồ dữ liệu, đã cho thấy lợi thế có thể đo lường được trong hiệu quả hoạt động và tăng trưởng doanh thu. Những nhà lãnh đạo này sử dụng phân tích nâng cao, trí tuệ nhân tạo và các mô hình ngôn ngữ lớn trên các nguồn dữ liệu đa dạng, bao gồm luồng thời gian thực, cảm biến IoT, phương tiện truyền thông xã hội và dữ liệu tương tác với khách hàng. Chiến lược dữ liệu toàn diện này cho phép họ đưa ra các quyết định dựa trên dữ liệu nhanh hơn, cá nhân hóa trải nghiệm khách hàng, tối ưu hóa hoạt động thông qua bảo trì dự đoán và xác định các cơ hội mới để tăng doanh thu trước đối thủ cạnh tranh.</p>","id":"seo-faq-pairs#what-are-the-benefits-of-using-a-data-lake","customSort":"2"},"metadata":{"tags":[{"id":"seo-faq-pairs#faq-collections#data-lake","name":"data-lake","namespaceId":"seo-faq-pairs#faq-collections","description":"<p>data-lake</p>","metadata":{}}]}},{"fields":{"faqQuestion":"Các yếu tố thiết yếu của giải pháp hồ dữ liệu và phân tích là gì?","faqAnswer":"<p>Trong quá trình xây dựng Hồ dữ liệu và nền tảng phân tích, tổ chức cần xem xét một số khả năng chủ chốt, trong đó có:</p> \n<h3>Di chuyển dữ liệu</h3> \n<p>Hồ dữ liệu cho phép bạn nhập bất kỳ lượng dữ liệu nào có thể đến theo thời gian thực. Dữ liệu được thu thập từ nhiều nguồn và chuyển sang kho dữ liệu ở định dạng gốc. Quá trình này vừa cho phép bạn thay đổi quy mô dữ liệu có kích cỡ bất kỳ, vừa tiết kiệm thời gian xác định cấu trúc, sơ đồ và chuyển đổi dữ liệu.</p> \n<h3>Lưu trữ và tạo danh mục dữ liệu một cách bảo mật</h3> \n<p>Hồ dữ liệu đem đến cho bạn khả năng lưu trữ dữ liệu quan hệ như cơ sở dữ liệu vận hành và dữ liệu từ ứng dụng lĩnh vực kinh doanh và dữ liệu không quan hệ như ứng dụng di động, thiết bị IoT và mạng xã hội. Các kho dữ liệu này cũng cho bạn khả năng nắm bắt dữ liệu có trong kho bằng các phương pháp thu thập, tạo danh mục và tạo chỉ mục dữ liệu. Cuối cùng, phải bảo mật dữ liệu để bảo đảm các nội dung dữ liệu được bảo vệ.</p> \n<h3>Phân tích</h3> \n<p>Hồ dữ liệu cho phép nhiều vai trò khác nhau trong tổ chức của bạn như nhà khoa học dữ liệu, nhà phát triển dữ liệu và chuyên viên phân tích kinh doanh truy cập dữ liệu bằng các công cụ và khung phân tích họ chọn. Tiến trình này bao gồm các khung mã nguồn mở như<a href=\"\">Apache Hadoop</a>, <a href=\"\">Presto</a> và <a href=\"\">Apache Spark</a>, cũng như các ưu đãi thương mại từ nhà cung cấp kho dữ liệu và nghiệp vụ thông minh. Hồ dữ liệu cho phép bạn chạy phân tích mà không cần di chuyển dữ liệu sang hệ thống phân tích riêng.</p> \n<p><a href=\"\" tabindex=\"0\">Tìm hiểu về Phân tích dữ liệu »</a></p> \n<h3>Machine Learning</h3> \n<p>Hồ dữ liệu sẽ đem đến cho tổ chức của bạn khả năng tạo nhiều loại thông tin chuyên sâu khác nhau, trong đó có báo cáo dữ liệu lịch sử và thực hiện máy học mà trong đó, các mô hình được xây dựng để dự đoán kết quả có thể thu được, cũng như đề xuất một loạt các hành động được quy định sẵn để đạt được kết quả tối ưu.</p> \n<p><a href=\"\" tabindex=\"0\">Tìm hiểu về công nghệ Máy học »</a></p>","id":"seo-faq-pairs#what-are-the-essential-elements-of-a-data-lake-and-analytics-solution","customSort":"3"},"metadata":{"tags":[{"id":"seo-faq-pairs#faq-collections#data-lake","name":"data-lake","namespaceId":"seo-faq-pairs#faq-collections","description":"<p>data-lake</p>","metadata":{}}]}},{"fields":{"faqQuestion":"Kho dữ liệu khác với hồ dữ liệu như thế nào?","faqAnswer":"<div> \n <p>Tùy theo yêu cầu, một tổ chức thông thường sẽ yêu cầu có cả một kho dữ liệu lẫn một kho lưu trữ dữ liệu để phục vụ các nhu cầu cũng như trường hợp sử dụng khác nhau.</p> \n <p>Kho lưu trữ dữ liệu là cơ sở dữ liệu được tối ưu hóa để phân tích dữ liệu quan hệ đến từ hệ thống giao dịch và ứng dụng lĩnh vực kinh doanh. Cấu trúc và sơ đồ dữ liệu được xác định trước để tối ưu hóa truy vấn SQL nhanh, trong đó, kết quả thường được sử dụng để báo cáo và phân tích vận hành. Dữ liệu sẽ được dọn dẹp, làm phong phú và biến đổi để có thể đóng vai trò “nguồn thông tin sự thật duy nhất” mà người dùng có thể tin tưởng.</p> \n <p><a href=\"\" tabindex=\"0\">Tìm hiểu về kho dữ liệu »</a></p> \n <p>Kho dữ liệu thuộc loại khác vì kho dữ liệu này lưu trữ dữ liệu quan hệ từ ứng dụng lĩnh vực kinh doanh và dữ liệu không quan hệ từ ứng dụng di động, thiết bị IoT và mạng xã hội. Cấu trúc hoặc sơ đồ dữ liệu không được xác định khi dữ liệu được ghi lại. Nghĩa là, bạn có thể lưu trữ toàn bộ dữ liệu của mình mà không phải thiết kế cẩn thận hay cần biết câu hỏi nào mà bạn có thể cần câu trả lời về sau. Bạn có thể sử dụng nhiều loại phân tích khác nhau trên dữ liệu của bạn như truy vấn SQL, phân tích dữ liệu lớn, tìm kiếm toàn văn bản, phân tích thời gian thực và machine learning để khám phá thông tin chuyên sâu.</p> \n <p>Khi các tổ chức sử dụng kho lưu trữ dữ liệu nhận thấy lợi ích của kho dữ liệu, họ sẽ biến đổi các kho của mình để đưa vào kho dữ liệu và mở ra năng lực sử dụng các khả năng truy vấn đa dạng, trường hợp sử dụng khoa học dữ liệu cũng như khả năng nâng cao để khám phá mô hình thông tin mới. Gartner đặt tên cho cuộc cách mạng này là “Giải pháp quản lý dữ liệu để phân tích”, hay còn gọi là “<a href=\"\" target=\"_blank\">DMSA</a>.”</p> \n <p>Để so sánh chuyên sâu giữa hồ dữ liệu và kho dữ liệu, hãy truy cập <a href=\"\">trang so sánh chuyên dụng của chúng tôi về hồ dữ liệu và kho dữ liệu</a>.</p> \n</div>","id":"seo-faq-pairs#how-does-a-data-warehouse-compare-to-a-data-lake","customSort":"4"},"metadata":{"tags":[{"id":"seo-faq-pairs#faq-collections#data-lake","name":"data-lake","namespaceId":"seo-faq-pairs#faq-collections","description":"<p>data-lake</p>","metadata":{}}]}},{"fields":{"faqQuestion":" Giá trị của hồ dữ liệu là gì?","faqAnswer":"<p>Khả năng tận dụng nhiều dữ liệu hơn từ nhiều tài nguyên hơn trong thời gian ngắn hơn cũng như giúp người dùng phối hợp và phân tích dữ liệu theo nhiều cách khác nhau sẽ giúp quyết định được đưa ra nhanh hơn và sáng suốt hơn. Các ví dụ về việc Hồ dữ liệu đã bổ sung thêm giá trị gồm có:</p> \n<h3>Cải thiện tương tác với khách hàng</h3> \n<p>Hồ dữ liệu có khả năng kết hợp dữ liệu khách hàng từ nền tảng CRM với phân tích mạng xã hội và nền tảng tiếp thị bao gồm lịch sử mua, yêu cầu giải quyết sự cố để giúp doanh nghiệp nắm bắt được đối tượng khách hàng đem lại nhiều lợi nhuận nhất, nguyên nhân khiến khách hàng khó chịu cũng như các khuyến mãi hoặc phần thưởng sẽ tăng sự trung thành của khách hàng.</p> \n<h3>Cải thiện lựa chọn sáng tạo của đội ngũ Nghiên cứu và phát triển</h3> \n<p>Kho dữ liệu có thể giúp đội ngũ Nghiên cứu và phát triển của bạn thử nghiệm giả thuyết, lọc giả định và đánh giá kết quả – ví dụ như chọn đúng nguyên liệu trong thiết kế sản phẩm sẽ đem lại hiệu suất cao hơn, thực hiện nghiên cứu về tính tiện lợi sẽ giúp tăng hiệu quả của thuốc men hoặc nắm bắt được khách hàng sẵn sàng trả tiền cho nhiều đặc tính khác nhau như thế nào.</p> \n<h3>Tăng hiệu quả vận hành</h3> \n<p>Internet of Things (IoT) đem lại nhiều cách hơn để thu thập dữ liệu các quy trình như sản xuất, với dữ liệu thời gian thực thu được từ các thiết bị được kết nối internet. Kho dữ liệu giúp việc lưu trữ và chạy phân tích dữ liệu IoT do máy tạo để khám phá các phương cách giảm chi phí vận hành và tăng chất lượng trở nên dễ dàng.</p> \n<p><a href=\"\" tabindex=\"0\">Tìm hiểu về Internet vạn vật (IoT) »</a></p>","id":"seo-faq-pairs#what-is-the-value-of-data-lakes","customSort":"5"},"metadata":{"tags":[{"id":"seo-faq-pairs#faq-collections#data-lake","name":"data-lake","namespaceId":"seo-faq-pairs#faq-collections","description":"<p>data-lake</p>","metadata":{}}]}},{"fields":{"faqQuestion":"Thách thức của hồ dữ liệu là gì?","faqAnswer":"<p>Thách thức chính của kiến trúc kho dữ liệu là dữ liệu thô được lưu trữ mà không có sự giám sát nội dung. Để kho dữ liệu có thể biến dữ liệu thành có thể sử dụng, kho này phải có cơ chế được quy định để tạo danh mục và bảo mật dữ liệu. Không có các thành phần này, bạn sẽ không thể tìm được dữ liệu hoặc kết quả đáng tin cậy trong “đầm lầy dữ liệu”. Đáp ứng nhu cầu của nhiều đối tượng mục tiêu hơn yêu cầu kho dữ liệu phải có sự quản trị, nhất quán về ngữ nghĩa cũng như các biện pháp kiểm soát truy cập.</p>","id":"seo-faq-pairs#what-are-the-challenges-of-data-lakes","customSort":"6"},"metadata":{"tags":[{"id":"seo-faq-pairs#faq-collections#data-lake","name":"data-lake","namespaceId":"seo-faq-pairs#faq-collections","description":"<p>data-lake</p>","metadata":{}}]}},{"fields":{"faqQuestion":"Làm thế nào để bạn triển khai hồ dữ liệu trên đám mây?","faqAnswer":"<p>Hồ dữ liệu là khối lượng công việc lý tưởng để triển khai trên nền tảng đám mây do đám mây đem đến hiệu năng, khả năng điều chỉnh quy mô, độ tin cậy, khả năng sử dụng, bộ công cụ phân tích đa dạng và khả năng quản lý kinh kế khổng lồ ở quy mô lớn. <a href=\"\">451 Research</a> phát hiện 66% số người trả lời nói rằng đám mây công cộng là môi trường lưu trữ đối tượng đang hoặc sẽ được sử dụng cho môi trường hồ dữ liệu chính của họ. Những lý do hàng đầu để khách hàng xem đám mây là lợi thế cho hồ dữ liệu là độ bảo mật cao hơn, thời gian triển khai nhanh hơn, độ sẵn sàng tốt hơn, cập nhật tính năng/chức năng thường xuyên hơn, độ linh hoạt cao hơn, độ bao phủ về mặt địa lý lớn hơn cũng như chi phí gắn liền với lượng sử dụng thực tế.</p>","id":"seo-faq-pairs#how-do-you-deploy-data-lakes-in-the-cloud","customSort":"7"},"metadata":{"tags":[{"id":"seo-faq-pairs#faq-collections#data-lake","name":"data-lake","namespaceId":"seo-faq-pairs#faq-collections","description":"<p>data-lake</p>","metadata":{}}]}},{"fields":{"faqQuestion":"AWS có thể hỗ trợ các yêu cầu của bạn về hồ dữ liệu như thế nào? ","faqAnswer":"<p>AWS cung cấp danh mục dịch vụ bảo mật, quy mô linh hoạt, toàn diện và tiết kiệm chi phí nhất cho phép khách hàng xây dựng kho dữ liệu của mình trên đám mây, phân tích toàn bộ dữ liệu của họ, đưa vào dữ liệu từ các thiết bị IoT với nhiều phương pháp phân tích đa dạng, trong đó có cả machine learning. Kết quả là, có nhiều tổ chức vận hành kho dữ liệu và quá trình phân tích của mình trên AWS nhiều hơn bất kỳ nơi đâu với các khách hàng như NETFLIX, Zillow, NASDAQ, Yelp, iRobot và FINRA tin tưởng giao cho AWS nhiệm vụ vận hành các khối lượng phân tích tối quan trọng đối với hoạt động kinh doanh của họ.</p> \n<p>Bắt đầu sử dụng hồ dữ liệu trên AWS bằng cách <a href=\"\" style=\"color:#0563c1; text-decoration:underline\">tạo tài khoản</a> ngay hôm nay.</p>","id":"seo-faq-pairs#how-can-aws-support-your-data-lakes-requirements","customSort":"8"},"metadata":{"tags":[{"id":"seo-faq-pairs#faq-collections#data-lake","name":"data-lake","namespaceId":"seo-faq-pairs#faq-collections","description":"<p>data-lake</p>","metadata":{}}]}}]},"metadata":{"auth":{},"pagination":{"empty":false,"present":true},"testAttributes":{}},"context":{"page":{"pageUrl":""},"environment":{"stage":"prod","region":"us-east-1"},"sdkVersion":"1.0.129"},"refMap":{"manifest.js":"3dea65b485","rt-faq.js":"003db38f04","rt-faq.css":"b00bda11a1","rt-faq.css.js":"0af1d62724","rt-faq.rtl.css":"f26a77ea1d","rt-faq.rtl.css.js":"efb444c1ed"},"settings":{"templateMappings":{"question":"faqQuestion","answer":"faqAnswer"}}}</script> <div data-eb-tpl-root="" data-reactroot=""> <div class="eb-faq"> <script type="application/ld+json">{"@context":"","@type":"FAQPage","mainEntity":[[{"@type":"Question","name":"Hồ dữ liệu là gì?","acceptedAnswer":{"@type":"Answer","text":"<p>Hồ dữ liệu là kho tập trung cho phép bạn lưu trữ toàn bộ dữ liệu có cấu trúc và không có cấu trúc ở bất kỳ quy mô nào. Bạn có thể lưu nguyên trạng dữ liệu mà không phải sắp xếp dữ liệu thành cấu trúc trước cũng như chạy nhiều loại phân tích khác nhau - từ bảng thông tin và hình ảnh trực quan đến xử lý dữ liệu lớn, phân tích theo thời gian thực và máy học để hỗ trợ đưa ra quyết định sáng suốt hơn.</p>"}},{"@type":"Question","name":"Vì sao bạn lại cần có kho dữ liệu?","acceptedAnswer":{"@type":"Answer","text":"<p>Các tổ chức thành công trong việc tạo giá trị kinh doanh từ dữ liệu của mình có kết quả tốt hơn đáng kể so với các tổ chức cùng loại khác. Một <a href=\"\">cuộc khảo sát của 451 Research</a> cho thấy hơn một nửa số doanh nghiệp được khảo sát hiện đã triển khai hồ dữ liệu, còn 22% doanh nghiệp khác có kế hoạch xây dựng hồ dữ liệu trong vòng 36 tháng tới. Các công ty triển khai kiến trúc dữ liệu hiện đại, bao gồm hồ dữ liệu, đã cho thấy lợi thế có thể đo lường được trong hiệu quả hoạt động và tăng trưởng doanh thu. Những nhà lãnh đạo này sử dụng phân tích nâng cao, trí tuệ nhân tạo và các mô hình ngôn ngữ lớn trên các nguồn dữ liệu đa dạng, bao gồm luồng thời gian thực, cảm biến IoT, phương tiện truyền thông xã hội và dữ liệu tương tác với khách hàng. Chiến lược dữ liệu toàn diện này cho phép họ đưa ra các quyết định dựa trên dữ liệu nhanh hơn, cá nhân hóa trải nghiệm khách hàng, tối ưu hóa hoạt động thông qua bảo trì dự đoán và xác định các cơ hội mới để tăng doanh thu trước đối thủ cạnh tranh.</p>"}},{"@type":"Question","name":"Các yếu tố thiết yếu của giải pháp hồ dữ liệu và phân tích là gì?","acceptedAnswer":{"@type":"Answer","text":"<p>Trong quá trình xây dựng Hồ dữ liệu và nền tảng phân tích, tổ chức cần xem xét một số khả năng chủ chốt, trong đó có:</p> \n<h3>Di chuyển dữ liệu</h3> \n<p>Hồ dữ liệu cho phép bạn nhập bất kỳ lượng dữ liệu nào có thể đến theo thời gian thực. Dữ liệu được thu thập từ nhiều nguồn và chuyển sang kho dữ liệu ở định dạng gốc. Quá trình này vừa cho phép bạn thay đổi quy mô dữ liệu có kích cỡ bất kỳ, vừa tiết kiệm thời gian xác định cấu trúc, sơ đồ và chuyển đổi dữ liệu.</p> \n<h3>Lưu trữ và tạo danh mục dữ liệu một cách bảo mật</h3> \n<p>Hồ dữ liệu đem đến cho bạn khả năng lưu trữ dữ liệu quan hệ như cơ sở dữ liệu vận hành và dữ liệu từ ứng dụng lĩnh vực kinh doanh và dữ liệu không quan hệ như ứng dụng di động, thiết bị IoT và mạng xã hội. Các kho dữ liệu này cũng cho bạn khả năng nắm bắt dữ liệu có trong kho bằng các phương pháp thu thập, tạo danh mục và tạo chỉ mục dữ liệu. Cuối cùng, phải bảo mật dữ liệu để bảo đảm các nội dung dữ liệu được bảo vệ.</p> \n<h3>Phân tích</h3> \n<p>Hồ dữ liệu cho phép nhiều vai trò khác nhau trong tổ chức của bạn như nhà khoa học dữ liệu, nhà phát triển dữ liệu và chuyên viên phân tích kinh doanh truy cập dữ liệu bằng các công cụ và khung phân tích họ chọn. Tiến trình này bao gồm các khung mã nguồn mở như<a href=\"\">Apache Hadoop</a>, <a href=\"\">Presto</a> và <a href=\"\">Apache Spark</a>, cũng như các ưu đãi thương mại từ nhà cung cấp kho dữ liệu và nghiệp vụ thông minh. Hồ dữ liệu cho phép bạn chạy phân tích mà không cần di chuyển dữ liệu sang hệ thống phân tích riêng.</p> \n<p><a href=\"\" tabindex=\"0\">Tìm hiểu về Phân tích dữ liệu »</a></p> \n<h3>Machine Learning</h3> \n<p>Hồ dữ liệu sẽ đem đến cho tổ chức của bạn khả năng tạo nhiều loại thông tin chuyên sâu khác nhau, trong đó có báo cáo dữ liệu lịch sử và thực hiện máy học mà trong đó, các mô hình được xây dựng để dự đoán kết quả có thể thu được, cũng như đề xuất một loạt các hành động được quy định sẵn để đạt được kết quả tối ưu.</p> \n<p><a href=\"\" tabindex=\"0\">Tìm hiểu về công nghệ Máy học »</a></p>"}},{"@type":"Question","name":"Kho dữ liệu khác với hồ dữ liệu như thế nào?","acceptedAnswer":{"@type":"Answer","text":"<div> \n <p>Tùy theo yêu cầu, một tổ chức thông thường sẽ yêu cầu có cả một kho dữ liệu lẫn một kho lưu trữ dữ liệu để phục vụ các nhu cầu cũng như trường hợp sử dụng khác nhau.</p> \n <p>Kho lưu trữ dữ liệu là cơ sở dữ liệu được tối ưu hóa để phân tích dữ liệu quan hệ đến từ hệ thống giao dịch và ứng dụng lĩnh vực kinh doanh. Cấu trúc và sơ đồ dữ liệu được xác định trước để tối ưu hóa truy vấn SQL nhanh, trong đó, kết quả thường được sử dụng để báo cáo và phân tích vận hành. Dữ liệu sẽ được dọn dẹp, làm phong phú và biến đổi để có thể đóng vai trò “nguồn thông tin sự thật duy nhất” mà người dùng có thể tin tưởng.</p> \n <p><a href=\"\" tabindex=\"0\">Tìm hiểu về kho dữ liệu »</a></p> \n <p>Kho dữ liệu thuộc loại khác vì kho dữ liệu này lưu trữ dữ liệu quan hệ từ ứng dụng lĩnh vực kinh doanh và dữ liệu không quan hệ từ ứng dụng di động, thiết bị IoT và mạng xã hội. Cấu trúc hoặc sơ đồ dữ liệu không được xác định khi dữ liệu được ghi lại. Nghĩa là, bạn có thể lưu trữ toàn bộ dữ liệu của mình mà không phải thiết kế cẩn thận hay cần biết câu hỏi nào mà bạn có thể cần câu trả lời về sau. Bạn có thể sử dụng nhiều loại phân tích khác nhau trên dữ liệu của bạn như truy vấn SQL, phân tích dữ liệu lớn, tìm kiếm toàn văn bản, phân tích thời gian thực và machine learning để khám phá thông tin chuyên sâu.</p> \n <p>Khi các tổ chức sử dụng kho lưu trữ dữ liệu nhận thấy lợi ích của kho dữ liệu, họ sẽ biến đổi các kho của mình để đưa vào kho dữ liệu và mở ra năng lực sử dụng các khả năng truy vấn đa dạng, trường hợp sử dụng khoa học dữ liệu cũng như khả năng nâng cao để khám phá mô hình thông tin mới. Gartner đặt tên cho cuộc cách mạng này là “Giải pháp quản lý dữ liệu để phân tích”, hay còn gọi là “<a href=\"\" target=\"_blank\">DMSA</a>.”</p> \n <p>Để so sánh chuyên sâu giữa hồ dữ liệu và kho dữ liệu, hãy truy cập <a href=\"\">trang so sánh chuyên dụng của chúng tôi về hồ dữ liệu và kho dữ liệu</a>.</p> \n</div>"}},{"@type":"Question","name":" Giá trị của hồ dữ liệu là gì?","acceptedAnswer":{"@type":"Answer","text":"<p>Khả năng tận dụng nhiều dữ liệu hơn từ nhiều tài nguyên hơn trong thời gian ngắn hơn cũng như giúp người dùng phối hợp và phân tích dữ liệu theo nhiều cách khác nhau sẽ giúp quyết định được đưa ra nhanh hơn và sáng suốt hơn. Các ví dụ về việc Hồ dữ liệu đã bổ sung thêm giá trị gồm có:</p> \n<h3>Cải thiện tương tác với khách hàng</h3> \n<p>Hồ dữ liệu có khả năng kết hợp dữ liệu khách hàng từ nền tảng CRM với phân tích mạng xã hội và nền tảng tiếp thị bao gồm lịch sử mua, yêu cầu giải quyết sự cố để giúp doanh nghiệp nắm bắt được đối tượng khách hàng đem lại nhiều lợi nhuận nhất, nguyên nhân khiến khách hàng khó chịu cũng như các khuyến mãi hoặc phần thưởng sẽ tăng sự trung thành của khách hàng.</p> \n<h3>Cải thiện lựa chọn sáng tạo của đội ngũ Nghiên cứu và phát triển</h3> \n<p>Kho dữ liệu có thể giúp đội ngũ Nghiên cứu và phát triển của bạn thử nghiệm giả thuyết, lọc giả định và đánh giá kết quả – ví dụ như chọn đúng nguyên liệu trong thiết kế sản phẩm sẽ đem lại hiệu suất cao hơn, thực hiện nghiên cứu về tính tiện lợi sẽ giúp tăng hiệu quả của thuốc men hoặc nắm bắt được khách hàng sẵn sàng trả tiền cho nhiều đặc tính khác nhau như thế nào.</p> \n<h3>Tăng hiệu quả vận hành</h3> \n<p>Internet of Things (IoT) đem lại nhiều cách hơn để thu thập dữ liệu các quy trình như sản xuất, với dữ liệu thời gian thực thu được từ các thiết bị được kết nối internet. Kho dữ liệu giúp việc lưu trữ và chạy phân tích dữ liệu IoT do máy tạo để khám phá các phương cách giảm chi phí vận hành và tăng chất lượng trở nên dễ dàng.</p> \n<p><a href=\"\" tabindex=\"0\">Tìm hiểu về Internet vạn vật (IoT) »</a></p>"}},{"@type":"Question","name":"Thách thức của hồ dữ liệu là gì?","acceptedAnswer":{"@type":"Answer","text":"<p>Thách thức chính của kiến trúc kho dữ liệu là dữ liệu thô được lưu trữ mà không có sự giám sát nội dung. Để kho dữ liệu có thể biến dữ liệu thành có thể sử dụng, kho này phải có cơ chế được quy định để tạo danh mục và bảo mật dữ liệu. Không có các thành phần này, bạn sẽ không thể tìm được dữ liệu hoặc kết quả đáng tin cậy trong “đầm lầy dữ liệu”. Đáp ứng nhu cầu của nhiều đối tượng mục tiêu hơn yêu cầu kho dữ liệu phải có sự quản trị, nhất quán về ngữ nghĩa cũng như các biện pháp kiểm soát truy cập.</p>"}},{"@type":"Question","name":"Làm thế nào để bạn triển khai hồ dữ liệu trên đám mây?","acceptedAnswer":{"@type":"Answer","text":"<p>Hồ dữ liệu là khối lượng công việc lý tưởng để triển khai trên nền tảng đám mây do đám mây đem đến hiệu năng, khả năng điều chỉnh quy mô, độ tin cậy, khả năng sử dụng, bộ công cụ phân tích đa dạng và khả năng quản lý kinh kế khổng lồ ở quy mô lớn. <a href=\"\">451 Research</a> phát hiện 66% số người trả lời nói rằng đám mây công cộng là môi trường lưu trữ đối tượng đang hoặc sẽ được sử dụng cho môi trường hồ dữ liệu chính của họ. Những lý do hàng đầu để khách hàng xem đám mây là lợi thế cho hồ dữ liệu là độ bảo mật cao hơn, thời gian triển khai nhanh hơn, độ sẵn sàng tốt hơn, cập nhật tính năng/chức năng thường xuyên hơn, độ linh hoạt cao hơn, độ bao phủ về mặt địa lý lớn hơn cũng như chi phí gắn liền với lượng sử dụng thực tế.</p>"}},{"@type":"Question","name":"AWS có thể hỗ trợ các yêu cầu của bạn về hồ dữ liệu như thế nào? ","acceptedAnswer":{"@type":"Answer","text":"<p>AWS cung cấp danh mục dịch vụ bảo mật, quy mô linh hoạt, toàn diện và tiết kiệm chi phí nhất cho phép khách hàng xây dựng kho dữ liệu của mình trên đám mây, phân tích toàn bộ dữ liệu của họ, đưa vào dữ liệu từ các thiết bị IoT với nhiều phương pháp phân tích đa dạng, trong đó có cả machine learning. Kết quả là, có nhiều tổ chức vận hành kho dữ liệu và quá trình phân tích của mình trên AWS nhiều hơn bất kỳ nơi đâu với các khách hàng như NETFLIX, Zillow, NASDAQ, Yelp, iRobot và FINRA tin tưởng giao cho AWS nhiệm vụ vận hành các khối lượng phân tích tối quan trọng đối với hoạt động kinh doanh của họ.</p> \n<p>Bắt đầu sử dụng hồ dữ liệu trên AWS bằng cách <a href=\"\" style=\"color:#0563c1; text-decoration:underline\">tạo tài khoản</a> ngay hôm nay.</p>"}}]]}</script> <div class="eb-sticky-sidebar"> <div class="eb-sidebar-wrapper"> <div class="eb-sidebar-content"> <span data-eb-item-id="seo-faq-pairs#what-is-a-data-lake"><a class="eb-sidebar-link lb-txt-bold lb-txt-none lb-txt-16 lb-txt eb-active" href="#seo-faq-pairs#what-is-a-data-lake">Hồ dữ liệu là gì?</a></span> <span data-eb-item-id="seo-faq-pairs#what-are-the-benefits-of-using-a-data-lake"><a class="eb-sidebar-link lb-txt-bold lb-txt-none lb-txt-16 lb-txt" href="#seo-faq-pairs#what-are-the-benefits-of-using-a-data-lake">Vì sao bạn lại cần có kho dữ liệu?</a></span> <span data-eb-item-id="seo-faq-pairs#what-are-the-essential-elements-of-a-data-lake-and-analytics-solution"><a class="eb-sidebar-link lb-txt-bold lb-txt-none lb-txt-16 lb-txt" href="#seo-faq-pairs#what-are-the-essential-elements-of-a-data-lake-and-analytics-solution">Các yếu tố thiết yếu của giải pháp hồ dữ liệu và phân tích là gì?</a></span> <span data-eb-item-id="seo-faq-pairs#how-does-a-data-warehouse-compare-to-a-data-lake"><a class="eb-sidebar-link lb-txt-bold lb-txt-none lb-txt-16 lb-txt" href="#seo-faq-pairs#how-does-a-data-warehouse-compare-to-a-data-lake">Kho dữ liệu khác với hồ dữ liệu như thế nào?</a></span> <span data-eb-item-id="seo-faq-pairs#what-is-the-value-of-data-lakes"><a class="eb-sidebar-link lb-txt-bold lb-txt-none lb-txt-16 lb-txt" href="#seo-faq-pairs#what-is-the-value-of-data-lakes"> Giá trị của hồ dữ liệu là gì?</a></span> <span data-eb-item-id="seo-faq-pairs#what-are-the-challenges-of-data-lakes"><a class="eb-sidebar-link lb-txt-bold lb-txt-none lb-txt-16 lb-txt" href="#seo-faq-pairs#what-are-the-challenges-of-data-lakes">Thách thức của hồ dữ liệu là gì?</a></span> <span data-eb-item-id="seo-faq-pairs#how-do-you-deploy-data-lakes-in-the-cloud"><a class="eb-sidebar-link lb-txt-bold lb-txt-none lb-txt-16 lb-txt" href="#seo-faq-pairs#how-do-you-deploy-data-lakes-in-the-cloud">Làm thế nào để bạn triển khai hồ dữ liệu trên đám mây?</a></span> <span data-eb-item-id="seo-faq-pairs#how-can-aws-support-your-data-lakes-requirements"><a class="eb-sidebar-link lb-txt-bold lb-txt-none lb-txt-16 lb-txt" href="#seo-faq-pairs#how-can-aws-support-your-data-lakes-requirements">AWS có thể hỗ trợ các yêu cầu của bạn về hồ dữ liệu như thế nào? </a></span> </div> </div> </div> <div class="eb-faq-content"> <div class="lb-none-v-margin lb-grid lb-small-pad lb-grid" data-eb-item-id="seo-faq-pairs#what-is-a-data-lake"> <div class="lb-row lb-row-max-large lb-snap eb-active"> <div class="lb-col lb-tiny-24 lb-mid-24"> <h2 class="lb-txt-bold lb-txt-none lb-txt-28 lb-h2 lb-title" id="seo-faq-pairs#what-is-a-data-lake">Hồ dữ liệu là gì?</h2> <div class="lb-txt-14 lb-rtxt"> <p>Hồ dữ liệu là kho tập trung cho phép bạn lưu trữ toàn bộ dữ liệu có cấu trúc và không có cấu trúc ở bất kỳ quy mô nào. Bạn có thể lưu nguyên trạng dữ liệu mà không phải sắp xếp dữ liệu thành cấu trúc trước cũng như chạy nhiều loại phân tích khác nhau - từ bảng thông tin và hình ảnh trực quan đến xử lý dữ liệu lớn, phân tích theo thời gian thực và máy học để hỗ trợ đưa ra quyết định sáng suốt hơn.</p> </div> </div> </div> </div> <div class="lb-none-v-margin lb-grid lb-small-pad eb-bg-dark" data-eb-item-id="seo-faq-pairs#what-are-the-benefits-of-using-a-data-lake"> <div class="lb-row lb-row-max-large lb-snap"> <div class="lb-col lb-tiny-24 lb-mid-24"> <h2 class="lb-txt-bold lb-txt-none lb-txt-28 lb-h2 lb-title" id="seo-faq-pairs#what-are-the-benefits-of-using-a-data-lake">Vì sao bạn lại cần có kho dữ liệu?</h2> <div class="lb-txt-14 lb-rtxt"> <p>Các tổ chức thành công trong việc tạo giá trị kinh doanh từ dữ liệu của mình có kết quả tốt hơn đáng kể so với các tổ chức cùng loại khác. Một <a href="">cuộc khảo sát của 451 Research</a> cho thấy hơn một nửa số doanh nghiệp được khảo sát hiện đã triển khai hồ dữ liệu, còn 22% doanh nghiệp khác có kế hoạch xây dựng hồ dữ liệu trong vòng 36 tháng tới. Các công ty triển khai kiến trúc dữ liệu hiện đại, bao gồm hồ dữ liệu, đã cho thấy lợi thế có thể đo lường được trong hiệu quả hoạt động và tăng trưởng doanh thu. Những nhà lãnh đạo này sử dụng phân tích nâng cao, trí tuệ nhân tạo và các mô hình ngôn ngữ lớn trên các nguồn dữ liệu đa dạng, bao gồm luồng thời gian thực, cảm biến IoT, phương tiện truyền thông xã hội và dữ liệu tương tác với khách hàng. Chiến lược dữ liệu toàn diện này cho phép họ đưa ra các quyết định dựa trên dữ liệu nhanh hơn, cá nhân hóa trải nghiệm khách hàng, tối ưu hóa hoạt động thông qua bảo trì dự đoán và xác định các cơ hội mới để tăng doanh thu trước đối thủ cạnh tranh.</p> </div> </div> </div> </div> <div class="lb-none-v-margin lb-grid lb-small-pad lb-grid" data-eb-item-id="seo-faq-pairs#what-are-the-essential-elements-of-a-data-lake-and-analytics-solution"> <div class="lb-row lb-row-max-large lb-snap"> <div class="lb-col lb-tiny-24 lb-mid-24"> <h2 class="lb-txt-bold lb-txt-none lb-txt-28 lb-h2 lb-title" id="seo-faq-pairs#what-are-the-essential-elements-of-a-data-lake-and-analytics-solution">Các yếu tố thiết yếu của giải pháp hồ dữ liệu và phân tích là gì?</h2> <div class="lb-txt-14 lb-rtxt"> <p>Trong quá trình xây dựng Hồ dữ liệu và nền tảng phân tích, tổ chức cần xem xét một số khả năng chủ chốt, trong đó có:</p> <h3>Di chuyển dữ liệu</h3> <p>Hồ dữ liệu cho phép bạn nhập bất kỳ lượng dữ liệu nào có thể đến theo thời gian thực. Dữ liệu được thu thập từ nhiều nguồn và chuyển sang kho dữ liệu ở định dạng gốc. Quá trình này vừa cho phép bạn thay đổi quy mô dữ liệu có kích cỡ bất kỳ, vừa tiết kiệm thời gian xác định cấu trúc, sơ đồ và chuyển đổi dữ liệu.</p> <h3>Lưu trữ và tạo danh mục dữ liệu một cách bảo mật</h3> <p>Hồ dữ liệu đem đến cho bạn khả năng lưu trữ dữ liệu quan hệ như cơ sở dữ liệu vận hành và dữ liệu từ ứng dụng lĩnh vực kinh doanh và dữ liệu không quan hệ như ứng dụng di động, thiết bị IoT và mạng xã hội. Các kho dữ liệu này cũng cho bạn khả năng nắm bắt dữ liệu có trong kho bằng các phương pháp thu thập, tạo danh mục và tạo chỉ mục dữ liệu. Cuối cùng, phải bảo mật dữ liệu để bảo đảm các nội dung dữ liệu được bảo vệ.</p> <h3>Phân tích</h3> <p>Hồ dữ liệu cho phép nhiều vai trò khác nhau trong tổ chức của bạn như nhà khoa học dữ liệu, nhà phát triển dữ liệu và chuyên viên phân tích kinh doanh truy cập dữ liệu bằng các công cụ và khung phân tích họ chọn. Tiến trình này bao gồm các khung mã nguồn mở như<a href="">Apache Hadoop</a>, <a href="">Presto</a> và <a href="">Apache Spark</a>, cũng như các ưu đãi thương mại từ nhà cung cấp kho dữ liệu và nghiệp vụ thông minh. Hồ dữ liệu cho phép bạn chạy phân tích mà không cần di chuyển dữ liệu sang hệ thống phân tích riêng.</p> <p><a href="">Tìm hiểu về Phân tích dữ liệu »</a></p> <h3>Machine Learning</h3> <p>Hồ dữ liệu sẽ đem đến cho tổ chức của bạn khả năng tạo nhiều loại thông tin chuyên sâu khác nhau, trong đó có báo cáo dữ liệu lịch sử và thực hiện máy học mà trong đó, các mô hình được xây dựng để dự đoán kết quả có thể thu được, cũng như đề xuất một loạt các hành động được quy định sẵn để đạt được kết quả tối ưu.</p> <p><a href="">Tìm hiểu về công nghệ Máy học »</a></p> </div> </div> </div> </div> <div class="lb-none-v-margin lb-grid lb-small-pad eb-bg-dark" data-eb-item-id="seo-faq-pairs#how-does-a-data-warehouse-compare-to-a-data-lake"> <div class="lb-row lb-row-max-large lb-snap"> <div class="lb-col lb-tiny-24 lb-mid-24"> <h2 class="lb-txt-bold lb-txt-none lb-txt-28 lb-h2 lb-title" id="seo-faq-pairs#how-does-a-data-warehouse-compare-to-a-data-lake">Kho dữ liệu khác với hồ dữ liệu như thế nào?</h2> <div class="lb-txt-14 lb-rtxt"> <div> <p>Tùy theo yêu cầu, một tổ chức thông thường sẽ yêu cầu có cả một kho dữ liệu lẫn một kho lưu trữ dữ liệu để phục vụ các nhu cầu cũng như trường hợp sử dụng khác nhau.</p> <p>Kho lưu trữ dữ liệu là cơ sở dữ liệu được tối ưu hóa để phân tích dữ liệu quan hệ đến từ hệ thống giao dịch và ứng dụng lĩnh vực kinh doanh. Cấu trúc và sơ đồ dữ liệu được xác định trước để tối ưu hóa truy vấn SQL nhanh, trong đó, kết quả thường được sử dụng để báo cáo và phân tích vận hành. Dữ liệu sẽ được dọn dẹp, làm phong phú và biến đổi để có thể đóng vai trò “nguồn thông tin sự thật duy nhất” mà người dùng có thể tin tưởng.</p> <p><a href="">Tìm hiểu về kho dữ liệu »</a></p> <p>Kho dữ liệu thuộc loại khác vì kho dữ liệu này lưu trữ dữ liệu quan hệ từ ứng dụng lĩnh vực kinh doanh và dữ liệu không quan hệ từ ứng dụng di động, thiết bị IoT và mạng xã hội. Cấu trúc hoặc sơ đồ dữ liệu không được xác định khi dữ liệu được ghi lại. Nghĩa là, bạn có thể lưu trữ toàn bộ dữ liệu của mình mà không phải thiết kế cẩn thận hay cần biết câu hỏi nào mà bạn có thể cần câu trả lời về sau. Bạn có thể sử dụng nhiều loại phân tích khác nhau trên dữ liệu của bạn như truy vấn SQL, phân tích dữ liệu lớn, tìm kiếm toàn văn bản, phân tích thời gian thực và machine learning để khám phá thông tin chuyên sâu.</p> <p>Khi các tổ chức sử dụng kho lưu trữ dữ liệu nhận thấy lợi ích của kho dữ liệu, họ sẽ biến đổi các kho của mình để đưa vào kho dữ liệu và mở ra năng lực sử dụng các khả năng truy vấn đa dạng, trường hợp sử dụng khoa học dữ liệu cũng như khả năng nâng cao để khám phá mô hình thông tin mới. Gartner đặt tên cho cuộc cách mạng này là “Giải pháp quản lý dữ liệu để phân tích”, hay còn gọi là “<a href="" target="_blank">DMSA</a>.”</p> <p>Để so sánh chuyên sâu giữa hồ dữ liệu và kho dữ liệu, hãy truy cập <a href="">trang so sánh chuyên dụng của chúng tôi về hồ dữ liệu và kho dữ liệu</a>.</p> </div> </div> </div> </div> </div> <div class="lb-none-v-margin lb-grid lb-small-pad lb-grid" data-eb-item-id="seo-faq-pairs#what-is-the-value-of-data-lakes"> <div class="lb-row lb-row-max-large lb-snap"> <div class="lb-col lb-tiny-24 lb-mid-24"> <h2 class="lb-txt-bold lb-txt-none lb-txt-28 lb-h2 lb-title" id="seo-faq-pairs#what-is-the-value-of-data-lakes"> Giá trị của hồ dữ liệu là gì?</h2> <div class="lb-txt-14 lb-rtxt"> <p>Khả năng tận dụng nhiều dữ liệu hơn từ nhiều tài nguyên hơn trong thời gian ngắn hơn cũng như giúp người dùng phối hợp và phân tích dữ liệu theo nhiều cách khác nhau sẽ giúp quyết định được đưa ra nhanh hơn và sáng suốt hơn. Các ví dụ về việc Hồ dữ liệu đã bổ sung thêm giá trị gồm có:</p> <h3>Cải thiện tương tác với khách hàng</h3> <p>Hồ dữ liệu có khả năng kết hợp dữ liệu khách hàng từ nền tảng CRM với phân tích mạng xã hội và nền tảng tiếp thị bao gồm lịch sử mua, yêu cầu giải quyết sự cố để giúp doanh nghiệp nắm bắt được đối tượng khách hàng đem lại nhiều lợi nhuận nhất, nguyên nhân khiến khách hàng khó chịu cũng như các khuyến mãi hoặc phần thưởng sẽ tăng sự trung thành của khách hàng.</p> <h3>Cải thiện lựa chọn sáng tạo của đội ngũ Nghiên cứu và phát triển</h3> <p>Kho dữ liệu có thể giúp đội ngũ Nghiên cứu và phát triển của bạn thử nghiệm giả thuyết, lọc giả định và đánh giá kết quả – ví dụ như chọn đúng nguyên liệu trong thiết kế sản phẩm sẽ đem lại hiệu suất cao hơn, thực hiện nghiên cứu về tính tiện lợi sẽ giúp tăng hiệu quả của thuốc men hoặc nắm bắt được khách hàng sẵn sàng trả tiền cho nhiều đặc tính khác nhau như thế nào.</p> <h3>Tăng hiệu quả vận hành</h3> <p>Internet of Things (IoT) đem lại nhiều cách hơn để thu thập dữ liệu các quy trình như sản xuất, với dữ liệu thời gian thực thu được từ các thiết bị được kết nối internet. Kho dữ liệu giúp việc lưu trữ và chạy phân tích dữ liệu IoT do máy tạo để khám phá các phương cách giảm chi phí vận hành và tăng chất lượng trở nên dễ dàng.</p> <p><a href="">Tìm hiểu về Internet vạn vật (IoT) »</a></p> </div> </div> </div> </div> <div class="lb-none-v-margin lb-grid lb-small-pad eb-bg-dark" data-eb-item-id="seo-faq-pairs#what-are-the-challenges-of-data-lakes"> <div class="lb-row lb-row-max-large lb-snap"> <div class="lb-col lb-tiny-24 lb-mid-24"> <h2 class="lb-txt-bold lb-txt-none lb-txt-28 lb-h2 lb-title" id="seo-faq-pairs#what-are-the-challenges-of-data-lakes">Thách thức của hồ dữ liệu là gì?</h2> <div class="lb-txt-14 lb-rtxt"> <p>Thách thức chính của kiến trúc kho dữ liệu là dữ liệu thô được lưu trữ mà không có sự giám sát nội dung. Để kho dữ liệu có thể biến dữ liệu thành có thể sử dụng, kho này phải có cơ chế được quy định để tạo danh mục và bảo mật dữ liệu. Không có các thành phần này, bạn sẽ không thể tìm được dữ liệu hoặc kết quả đáng tin cậy trong “đầm lầy dữ liệu”. Đáp ứng nhu cầu của nhiều đối tượng mục tiêu hơn yêu cầu kho dữ liệu phải có sự quản trị, nhất quán về ngữ nghĩa cũng như các biện pháp kiểm soát truy cập.</p> </div> </div> </div> </div> <div class="lb-none-v-margin lb-grid lb-small-pad lb-grid" data-eb-item-id="seo-faq-pairs#how-do-you-deploy-data-lakes-in-the-cloud"> <div class="lb-row lb-row-max-large lb-snap"> <div class="lb-col lb-tiny-24 lb-mid-24"> <h2 class="lb-txt-bold lb-txt-none lb-txt-28 lb-h2 lb-title" id="seo-faq-pairs#how-do-you-deploy-data-lakes-in-the-cloud">Làm thế nào để bạn triển khai hồ dữ liệu trên đám mây?</h2> <div class="lb-txt-14 lb-rtxt"> <p>Hồ dữ liệu là khối lượng công việc lý tưởng để triển khai trên nền tảng đám mây do đám mây đem đến hiệu năng, khả năng điều chỉnh quy mô, độ tin cậy, khả năng sử dụng, bộ công cụ phân tích đa dạng và khả năng quản lý kinh kế khổng lồ ở quy mô lớn. <a href="">451 Research</a> phát hiện 66% số người trả lời nói rằng đám mây công cộng là môi trường lưu trữ đối tượng đang hoặc sẽ được sử dụng cho môi trường hồ dữ liệu chính của họ. Những lý do hàng đầu để khách hàng xem đám mây là lợi thế cho hồ dữ liệu là độ bảo mật cao hơn, thời gian triển khai nhanh hơn, độ sẵn sàng tốt hơn, cập nhật tính năng/chức năng thường xuyên hơn, độ linh hoạt cao hơn, độ bao phủ về mặt địa lý lớn hơn cũng như chi phí gắn liền với lượng sử dụng thực tế.</p> </div> </div> </div> </div> <div class="lb-none-v-margin lb-grid lb-small-pad eb-bg-dark" data-eb-item-id="seo-faq-pairs#how-can-aws-support-your-data-lakes-requirements"> <div class="lb-row lb-row-max-large lb-snap"> <div class="lb-col lb-tiny-24 lb-mid-24"> <h2 class="lb-txt-bold lb-txt-none lb-txt-28 lb-h2 lb-title" id="seo-faq-pairs#how-can-aws-support-your-data-lakes-requirements">AWS có thể hỗ trợ các yêu cầu của bạn về hồ dữ liệu như thế nào? </h2> <div class="lb-txt-14 lb-rtxt"> <p>AWS cung cấp danh mục dịch vụ bảo mật, quy mô linh hoạt, toàn diện và tiết kiệm chi phí nhất cho phép khách hàng xây dựng kho dữ liệu của mình trên đám mây, phân tích toàn bộ dữ liệu của họ, đưa vào dữ liệu từ các thiết bị IoT với nhiều phương pháp phân tích đa dạng, trong đó có cả machine learning. 