Too Big to Ignore (Quá lớn để bỏ qua)

Phil Simon

Nguồn: Blinkist

Người dịch: Chi Phạm

Biên tập: Dung Zinh

Tóm tắt
Too Big to Ignore (Quá lớn để bỏ qua)  giải thích vì sao Big Data đóng vai trò vô cùng quan trọng trong kinh doanh cũng như việc phân tích Big Data có thể là một cuộc cách mạng đối với công ty của bạn. Cuốn sách dẫn dắt bạn từng bước tìm hiểu những công cụ mà bạn cần để sử dụng Big Data cũng như tương lai của Big Data đối với hoạt động kinh doanh và đời sống của  con người.
Ai nên đọc cuốn sách này?

  • Những ai quan tâm đến doanh nghiệp hoặc kinh doanh
  • Những ai có hứng thú với công nghệ
  • Những ai đang tìm hiểu về Big Data để ứng dụng vào hoạt động kinh doanh của công ty mình

Về tác giả
Phil Simon là một nhà tư vấn công nghệ, tác giả của cuốn sách The Age of the Platform. Tác phẩm của ông đã được nhắc đến trên các kênh truyền thông như NBC, CNBC, ABC, cũng như các tạp chí BusinessWeek the Huffington Post.

Cuốn sách mang lại cho tôi điều gì?
Tại sao Big Data lại quan trọng và làm thế nào để ứng dụng sức mạnh của Big Data trong hoạt động kinh doanh.

Bạn làm gì khi nghe mọi người nhắc đến Big Data? Ra vẻ gật gù nhưng trong lòng đang hy vọng không ai hỏi mình về nó? Hay băn khoăn liệu mình có nên tìm hiểu Big Data thực sự là gì? Hay chỉ xem nó như một thuật ngữ thông dụng nào đó?
Đã đến lúc chúng ta nên suy nghĩ nghiêm túc về Big Data. Như Phil Simon đề cập trong cuốn sách này, Big Data không chỉ đơn thuần là quá lớn, mà còn vô cùng quan trọng đến mức không thể xem thường.
Cuốn sách này chỉ ra tại sao Big Data bỗng trở nên liên quan đến rất nhiều vấn đề và làm thế nào để bạn tận dụng hết ưu thế của nó. Đấy cũng là lý do khiến quyển sách nằm trong danh mục các sách không thể bỏ qua. Nếu bạn muốn cải thiện hoạt động kinh doanh hay tổ chức của mình, bạn cần biết cách vận dụng Big Data.
Sau khi đọc cuốn sách này, bạn sẽ biết cách:
Làm thế nào để điểu chỉnh hoạt động kinh doanh của mình theo hướng sử dụng Big Data
Làm thể nào để minh hoạ Big Data
Các công ty như như Netflix sử dụng Big Data như thế nào để thúc đẩy hoạt động kinh doanh, phát triển nhanh chóng

Thay đổi về dạng thức tiêu dùng và chi phí công nghệ ngày càng rẻ đã thúc đẩy sự phát triển của Big Data

Ngày nay, ai ai cũng nói về Big Data và rất nhiều công ty tuyển dụng những chuyên gia dữ liệu để hiểu và ứng dụng Big Data vào hoạt động kinh doanh. Vậy chính xác thì Big Data là gì? Và tại sao nó lại có sức ảnh hưởng rộng lớn ở thời điểm này?
Big Data đề cập  đến những bộ dữ liệu quá khổng lồ và phức tạp để có thể xử lý một cách dễ dàng. Những bộ dữ liệu này không thể xử lý được nếu chỉ sử dụng những phần mềm cơ bản như Microsoft Excel hay Access.
Sự phát triển của nó được thúc đẩy bằng chính thực tế chúng ta đang thay đổi  các dạng thức tiêu dùng của mình. Smartphone, điện toán đám mây hay kết nối băng thông rộng khiến chúng ta không ngừng tiêu dùng và tạo ra dữ liệu mỗi phút, mỗi giây.
Cách thức kết nối mới mẻ, nhanh chóng và đơn giản này đảm bảo rằng chúng ta luôn luôn “online”, gần như mọi lúc mọi nơi. Hãy nghĩ xem điều đầu tiên bạn sẽ làm khi chuyến bay của bạn vừa hạ cánh là gì? Bật điện thoại và sau đó là kiểm tra email, Facebook hay Twitter. Khi bạn làm những việc đó, bạn không chỉ truy cập vào dữ liệu mà bạn còn đang tạo ra chúng. Chính những hoạt động này đã tạo ra Big Data.
Các cách thức tiêu dùng của chúng ta đã thay đổi nhờ chi phí công nghệ ngày càng rẻ. Chi phí công nghệ – đặc biệt là cho lưu trữ dữ liệu và băng thông – ngày nay đã trở nên thấp vô cùng. Sự thay đổi này là không thể chối cãi. Công nghệ hiện đại với giá cả phải chăng đã cho phép và thậm chí khuyến khích chúng ta đóng góp vào Big Data. Bạn sẽ tải được bao nhiêu chương trình truyền hình dài tập nếu mỗi tập tiêu tốn 10$ cho băng thông, chưa tính đến tổng số phí thuê hay mua nó?
Nếu như năm 1990, để lưu trữ 1GB dữ liệu bạn phải mất $10,000 thì đến năm 2010, chi phí này tụt xuống chỉ còn 10 cents. Chi phí công nghệ hợp lý và Big Data cho phép tải lên Youtube 48 giờ video mỗi phút. Nó cũng cho phép hơn 200 tỷ video được xem mỗi tháng. Nếu không có Big Data, liệu những điều này có khả thi? Vậy thì chúng ta sẽ làm gì với nó?

Big Data có thể đem lại cho bạn những hiểu biết sâu hơn về khách hàng và hoạt động kinh doanh

Vậy thì điều gì làm Big Data khác biệt so với các loại dữ liệu khác, chẳng hạn dữ liệu được thu thập vào những năm 1950?
Đó không chỉ là vấn đề khối lượng dữ liệu mà còn là định dạng của dữ liệu cũng đã thay đổi. Phần lớn dữ liệu trong kỷ nguyên Big Data là Dữ liệu phi cấu trúc (unstructured) (là loại dữ liệu chưa được định nghĩa hoặc phân tích từ trước. Đó có thể là dữ liệu dạng text, thông tin, ngày tháng…). Trước đây, dữ liệu thường là dạng dữ liệu quan hệ, dạng này đơn giản hơn và có thể dễ dàng sử dụng bảng biểu để xử lý. Chẳng hạn một bảng biểu sử dụng một cột hiển thị thông tin khách hàng và một cột khác hiển thị thông tin sản phẩm họ đã mua.
Ngược lại, dữ liệu phi cấu trúc lại vô cùng hỗn độn. Chúng không thể được sắp xếp theo những cách giống nhau. Mỗi dòng tweet về sản phẩm của bạn là một mẩudữ liệu nhưng bạn không thể đơn thuần đưa những dòng tweet vào cùng một bảng biểu.
Tại sao? Bởi vì những dòng tweet không chỉ có một mối quan hệ đến một thứ khác. Thử tưởng tượng nếu ai đó đưa dòng tweet về việc họ đang xem xét sản phẩm của bạn. Dòng tweet đó có thể chứa đựng rất nhiều thông tin, chẳng hạn, tuổi tác, sở thích, trình độ học vấn của người đó, và nhiều hơn thế nữa. Vậy nên đơn giản là bạn không thể tạo một bảng biểu với “Dòng Tweet số 1” và tất cả các đặc điểm, thông tin của dòng tweet ở càng cột tiếp theo – đó sẽ là một bảng tính khổng lồ tới mức không thể quản lý nổi. Giờ hãy tưởng tượng bạn làm điều tương tự với hàng ngàn, hàng ngàn dòng tweet khác! Quả thật là bất khả thi.

Và đó chính là lý do khiến dữ liệu trở nên “phi cấu trúc”. Ngày nay, dữ liệu phi cấu trúc chiếm hơn 80% dữ liệu của các tổ chức. Nếu chúng ta có thể học cách quản lý dữ liệu phi cấu trúc, chúng ta có thể hiểu được rất nhiều điều về hành vi người tiêu dùng. Dữ liệu phi cấu trúc thực là một cơ hội vô cùng to lớn.
Netflix (công ty cung cấp dịch vụ xem phim trực tuyến) là một ví dụ hoàn hảo cho điều này. Công ty này theo dõi các thông tin như ở đâu, khi nào và bao nhiêu lần các bộ phim được xem cũng như việc khách hàng sử dụng thiết bị gì để xem các bộ phim đó (điện thoại, máy tính bảng hay máy tính cá nhân…). Netflix đồng thời theo dõi các bình luận của người tiêu dùng về công ty mình trên Facebook hay Twitter.

Mùa hè năm 2011, Netflix mất khoảng 800,000 khách hàng. Khi công ty này xem xét đánh giá những bình luận của khách hàng về mình trên mạng xã hội, họ nhận ra rằng nhiều khách hàng đã từ bỏ Netflix vì thương hiệu và giá cả của sản phẩm DVD của họ đã bị Qwikster (dịch vụ chuyển phát nhanh của họ) định vị lại. Sau đó Netflix đã chấm dứt giao dịch qua Qwikster và hoạt động kinh doanh của công ty được phục hồi.


Hiển thị dữ liệu sẽ cho phép bạn phân tích các xu hướng


Vậy ngay cả khi bạn sắp xếp được dữ liệu phi cấu trúc của mình thì làm thể nào để phân tích, đánh giá nó? Làm thế nào để có thể hiểu được điều gì đó từ hàng triệu mẩu thông tin khác nhau?

Có hai cách tiếp cận chính ở đây. Thứ nhất, phân tích dữ liệu theo thời gian (time series analysis).
Chẳng hạn ta có thể dễ dàng để dự đoán rằng doanh số bán hàng sẽ tăng trong dịp Black Friday, nhưng việc phân tích dữ liệu qua thời gian sẽ cho chúng ta cái nhìn sâu hơn về điều này.

Nó có thể chỉ ra mối quan hệ giữa doanh số bán hàng với  ngày mà khách hàng được nhận lương – thông thường là ngày 1 và 15 hàng tháng. Nó còn có thể phân biệt được xu hướng dài hạn và xu hướng thời vụ. Một phân tích dữ liệu qua thời gian còn có thể tính đến những thời điểm doanh số bán hàng biến động bất thường – chẳng hạn nếu ai đó trúng xổ số và dẫn bạn bè đi mua sắm thả phanh.  
Khi bạn có thể hiểu được dữ liệu của mình, bạn sẽ có thể đảm bảo rằng mình không xây dựng chiến lược dựa trên những biến động tạm thời. Bạn sẽ không tăng lượng hàng tồn kho chỉ bởi vì một người trúng xổ số ghé thăm của hàng của bạn.
Cách tiếp cận thứ hai, bản đồ nhiệt (heat map), giúp bạn hiển thị một lượng lớn dữ liệu một cách dễ dàng.

Bản đồ nhiệt thể hiện các giá trị bằng các màu sắc khác nhau, vì vậy có thể chỉ ra cho bạn nhiều thông tin hơn là những phương pháp hiển thị dữ liệu thông thường.
Một bảng biểu với 100 triệu điểm dữ liệu chắc chắc sẽ không nói lên được gì nhiều; và về mặt kỹ thuật các biểu đồ có thể tiết lộ nhiều thông tin hơn nhưng nó cũng chỉ thể hiện mối quan hệ của hai biến. Bản đồ nhiệt, ngược lại, có thể cung cấp cái nhìn tổng thể của nhiều biến cùng một lúc. Chẳng hạn, nó có thể đánh giá số lượng, nội dung và địa điểm của những quyển sách bán ra. Nó cũng giúp trực giác của bạn hiểu rõ dữ liệu hơn.
Bạn có thể khám phá ra những xu hướng bằng cách nhìn vào mật độ màu sắc trên bản đồ nhiệt. Chẳng hạn, rất nhiều chấm đỏ trong một khu vực trên bản đồ có thể chỉ ra doanh số bán hàng tăng cao vào mùa hè trong một địa bàn nào đó.


Hãy sử dụng các nền tảng mới mẻ và đột phá để quản lý các công việc về Big Data – hoặc  thuê dịch vụ bên ngoài.


Đây là một vài tin, cả tin tốt lẫn tin xấu, về dữ liệu lớn Big Data: Bạn sẽ không bao giờ dùng Excel và Access nữa. Bạn sẽ phải dùng những nền tảng công nghệ mới nếu bạn muốn thành công với Big Data, và những nền tảng đó phải có tính linh hoạt.
Hadoop, chẳng hạn, là một tập hợp lớn các dự án quản lý dữ liệu. Nó không có một cấu hình tiêu chuẩn nào. Thay vào đó, nó được tạo nên bởi một vài dự án con mà mỗi dự án đều khá phức tạp.
Những công việc chính xác của Hadoop mang tính kỹ thuật cao nhưng nó là một công cụ cần thiết để chia những công việc liên quan đến Big Data thành những nhiệm vụ nhỏ hơn. Những nhiệm vụ con này sẽ được xử lý riêng biệt và được đưa vào các bộ dữ liệu mới. Facebook dùng Hadoop để phân tích những lát cắt khổng lồ về dữ liệu người dùng.
Nếu bạn không muốn bỏ chi phí cho những phần cứng để quản lý Big Data, bạn có thể thuê ngoài một công ty công nghệ làm việc này. Nếu bạn muốn, bạn có thể kiểm tra bằng việc thuê một công ty khác chạy các số liệu Big Datavà xem liệu nó có mang lại lợi nhuận hay không. Kaggle, một công ty khởi nghiệp online được tạo ra vì mục đích này.
Kaggle cho phép bạn post các nhiệm vụ liên quan đến Big Data và tìm kiếm các nhà chuyên gia về dữ liệu, người có thể giúp bạn giải quyết các nhiệm vụ đó. Thậm chí ngay cả khi bạn không biết mình nên làm gì với dữ liệu của mình, thành viên của Kaggle có thể gợi ý cho bạn. Thành viên của Kaggle đã từng được đưa các thông tin về chuyến bay và thời tiết và hỏi về cách dự báo thời gian cất cánh, hạ cánh, thời gian rời cửa sân bay hoặc đến cửa sân bay của máy bay. Họ phải giúp đặt lịch trình các chuyến bay để thích nghi với các điều kiện đang thay đổi. Người chiến thắng đã dự báo chính xác hơn 40% so với tiêu chuẩn của ngành hàng không.
Nói tóm lại, bạn phải tìm cho mình cách tốt nhất để quản lý Big Data. Luôn luôn đặt câu hỏi liệu mình có đang làm điều tốt nhất cho mình hay không.


Hãy chắc chắn rằng công ty của bạn thực sự sẵn sàng cho kỷ nguyên Big Data


Thậm chí ngay cả khi sẵn sàng với Big Data, bạn vẫn cần tạm ngừng lại. Bạn phải chắc chắc rằng cả công ty của bạn cũng đã sẵn sàng như chính bạn.

Mặc dù có một số công cụ miễn phí thì việc thu thập và sử dụng dữ liệu vẫn sẽ tiêu tốn chi phí của bạn.

Hadoop hoàn toàn miễn phí nhưng bạn vẫn phải dành một phần ngân sách đáng kể cho việc tư vấn và đào tạo, để đảm bảo rằng việc đầu tư vào Big Data là xứng đáng.

Đừng nghĩ rằng Big Data chỉ là một chương trình mới, sẽ mang lại lợi nhuận và hiệu quả khi bạn cài đặt nó. Big Data đòi hỏi bạn tái cấu trúc cách tiếp cận công nghệ và dữ liệu nói chung.

Explorys, một công ty sử dụng Big Data để nâng cao chất lượng dịch vụ y tế đã nhận ra điều này khi họ bắt đầu. Họ phải xây dựng mạng lưới để lưu trữ dữ liệu, phát triển một platform để có thể làm việc với các nhà cung cấp dịch vụ y tế khác nhau. Đồng thời họ cũng phải thành lập một bộ phận mới với hơn 100 nhân viên.

Và ngay cả khi bạn có trong tay một công cụ Big Data tuyệt vời, hãy nhớ rằng nó chỉ có ích thực sự khi bạn có một nguồn dữ liệu tốt. Ngay cả công cụ tốt nhất cũng trở nên vô nghĩa nên bạn không thu thập được những dữ liệu hữu ích.

Vậy hãy bắt đầu bằng việc đặt các câu hỏi cụ thể và đề ra những mục tiêu ngắn hạn cũng như dài hạn. Bạn phải biết chính xác bạn cần thông tin gì, nếu không bạn sẽ không thể tìm ra cách để lấy dữ liệu.

Tìm hiểu xem kiểu khách hàng như thế nào sẽ làm nên thành công cho một sản phẩm nào đó, chẳng hạn điều gì làm khách hàng rời bỏ thương hiệu của bạn. Sau đó, thu thập nhiều dữ liệu nhất có thể về các khách hàng cũ và khách hàng hiện tại.

Cuối cùng, dùng các thông tin này để dự báo sản phẩm nào sẽ vào được khách hàng ưa chuộng. Bạn cũng có thể biết được khi nào thì khách hàng sắp sửa rời bỏ bạn, và nhờ đó bạn có thể đề ra chiến lược để lôi kéo họ quay lại với mình.

Big Data đặt những thách thức lớn hơn về các vấn đề an ninh và đạo đức

 

Big Data không phải là không có điểm bất cập. Bạn không sai khi cho rằng việc lưu trữ một lượng dữ liệu khổng lồ về mọi người nghe có gì đó không ổn. Big Data đưa những vấn đề về bảo mật riêng tư lên một tầm cao mới. Hẳn sẽ là thảm họa nếu một lượng dữ liệu Big Data nào đó rơi vào tay kẻ xấu.

Apple và Amazon chẳng hạn, cả hai đều có thông tin thẻ tín dụng của khoảng 400 triệu khách hàng. Điều đó có nghĩa gì đối với những kẻ hacker hay đánh cắp dữ liệu?

Thậm chí khi giả sử rằng chúng ta có thể tin tưởng khi trao dữ liệu cho những công ty này (đây không nhất thiết là một giả thuyết đúng), vẫn có rất nhiều trường hợp dữ liệu bị đánh cắp. Vì vậy các công ty phải bảo vệ dữ liệu của khách hàng bên cạnh việc bảo vệ dữ liệu nội bộ của họ.

Năm 2012, Google đã gặp phải rắc rối khi tiết lộ rằng, phần mềm Street View của họ đang thu thập dữ liệu từ các mạng Wifi miễn phí. Đây chính là mặt trái của Big Data: nó đang de dọa sự riêng tư của chúng ta.

Những công ty khổng lồ như Google, Amazon và Facebook có thể khai thác dữ liệu người dùng không giới hạn nếu họ muốn. Nếu điều này làm bạn lo lắng, bạn có thể xem xét sử dụng các dịch vụ thay thế khác như DuckDuckGo – một công cụ tìm kiếm không lưu trữ dữ liệu người dùng.

 

Big Data sẽ giúp các sản phẩm “thông minh hơn”

 

Vậy đâu là tương lai cho Big Data?  Một số người đã xem nhẹ ảnh hưởng của nó đến thị trường người tiêu dùng.

Ví dụ như, chúng ta sẽ thấy có sự dịch chuyển dần từ dữ liệu chủ động sang dữ liệu bị động.

Hiện nay, phần lớn dữ liệu của chúng được tạo ra một cách chủ động. Nghĩa là chúng ta sử dụng internet hàng ngày bằng laptop, smartphone và chính chúng ta tạo ra dữ liệu.

Nhưng càng ngày lượng dữ liệu sẽ được tạo ra một cách bị động càng nhiều lên. Chúng ta sẽ có ô tô, TV và nhiều thiết bị khác sẽ kết nối internet và sẽ theo dõi mọi hành vi của chúng ta. Những công nghệ này sẽ tự tạo ra dữ liệu.

Điều này dĩ nghiên nghe có vẻ như xâm phạm quyền riêng tư. Tuy nhiên nó cũng có nghĩa là công nghệ sẽ tự thích nghi với từng hành vi cụ thể của chúng ta.

Trong tương lai, công nghệ sẽ có thể sử dụng dữ liệu một cách hiệu quả hơn. Tony Fadel, người thiết kế Ipod đã phát triển một chương trình cho công ty mới của mình, Nest, là một ví dụ.

Một trong những sản phẩm của Nest là máy điều nhiệt. Sảm phẩm này sẽ thu thập dữ liệu của người dùng để tự điều chỉnh nhiệt độ theo mong muốn của họ.

Bạn sẽ không phải lập trình Nest sau khi nó thu thập dữ liệu của bạn – nó sẽ tự sử dụng dữ liệu để làm việc đó. Chẳng hạn, nó có thể biết được bạn thích phòng khách lạnh hơn vào ban ngày và phòng ngủ ấm hơn vào ban đêm. Bạn sử dụng càng nhiều, nó sẽ càng hiểu và đáp ứng nhu cầu của bạn tốt hơn.

Những dữ liệu được thu thập có trật tự và được kết nối mạng. Vì vậy, bạn sẽ có thể điều chỉnh nhiệt độ bằng smartphone và xem lại các dữ liệu trong quá khứ. Rõ ràng là Big Data đang có ảnh hưởng lớn đến công nghệ, môi trường và đời sống của chúng ta. Liệu bạn có trở thành một phần của nó?

Tóm tắt cuối

Thông điệp chính của cuốn sách:

Big Data đòi hỏi một lối tư duy mới, các công cụ mới, một cách tiếp cận mới với việc phân tích dữ liệu nói chung. Tuy nhiên nếu bạn có thể quản lý được các dữ liệu phi cấu trúc, lợi ích mà nó mang lại là vô cùng lớn. Big Data sẽ đóng vai trò ngày càng quan trọng trong tương lai của chúng ta. Vì vậy, đừng bỏ lỡ!

Lời khuyên thiết thực:

Hãy thử nghiệm

Bạn cảm thấy vẫn lơ mơ về việc sử dụng Big Data? Thực ra bạn  không nhất thiết phải trực tiếp thực hiện. Hãy yêu cầu một công ty chuyên về về Big Data như Kaggle phân tích một số dữ liệu cho bạn. Bạn sẽ hiểu được một số vấn đề và biết được liệu mình đã sẵn sàng cho Big Data hay chưa. Đừng vội vã – chậm mà chắc và đảm bảo rằng bạn được chuẩn bị sẵn sàng cho nó.

Đọc thêm: Big Data; tác giả Viktor Mayer-Schönberger và  Kenneth Cukier

Cuốn sách này đem lại một cái nhìn sâu hơn về việc tại sao thay đổi sang “big data’ là một sự chuyển đổi quan trọng trong cách chúng ta thu thập, sử dụng và suy nghĩ về dữ liệu xung quanh mình. Nó giải thích kỹ càng và đưa ra những ví dụ sinh động về việc làm thế nào mà nhiều cá nhân và doanh nghiệp đã đi trước thời đại về việc sử dụng các công cụ Big Data để tạo ra giá trị và lợi nhuận.

Xa hơn nữa, cuốn sách đồng thời cũng chỉ ra những vấn đề của xã hội Big Data trong tương lai liên quan đến rủi ro, cơ hội và các vấn đề pháp lý.

Leave a Reply

Your email address will not be published. Required fields are marked *