Chuyển đến nội dung chính

CÁI GÌ TO NHẤT TRÊN ĐỜI?

Con gái của một người bạn tôi, lần đầu tiên đến trường mẫu giáo. Cô giáo hỏi một đám con nít cỡ năm tuổi: "Cái gì to nhất trên đời?"
"Ba của em", một bé gái nói.
"Con voi", một bé trai vừa đi chơi sở thú về đáp.
"Quả núi", một đứa khác trả lời.
Con gái của bạn tôi nói, "Mắt của em là cái to nhất trên đời"
Cả lớp đều im lặng vì cố gắng tìm hiểu ý nghĩa của câu nói. "Em nói vậy nghĩa là sao?", cô giáo ngạc nhiên hỏi.
Nhà nữ triết gia tí hon đáp: "Mắt của em có thể nhìn thấy ba và con voi. Có thể thấy quả núi và nhiều thứ khác nữa. Và bởi vì tất cả đều những thứ đó đều chứa trong mắt em, nên mắt em là cái to nhất thế giới!"
Trí tuệ không phải do học hỏi, mà do nhìn thấy được những gì không thể dạy.
~Trích Ai mua xe rác~

Nhận xét

Bài đăng phổ biến từ blog này

KĨ THUẬT LẬP TRÌNH

Nhân cái ngày mưa gió này làm cái blog vui :) Dựa trên đề cương ôn tập môn Kĩ thuật lập trình (Programming Technique) của thầy Trịnh Thành Trung 1. Thứ tự thực hiện các phép toán trong C 1.1 Vi ết chương trình nhập các tham số tương ứng và tính giá trị các biểu thức sau    int a,b,c,d;    a=b=c++=d=10;    in ra a,b,c,d    a=b=++c=d=10;    in ra a,b,c,d    Giữ nguyên đoạn code trên, sửa dòng khai báo thành   int a,c,d,b; chạy chương trình và xem kết quả và đưa ra nhận xét  Trong biểu thức gán  a=b=c++=d=10; (1) a=b=++c=d=10; (2) khi cho vào trình biên dịch chạy (như của mình là TDM GCC 4.9.2 64bit Release) thì biểu thức (1) sinh ra lỗi, trình biên dịch thông báo   "[Error] lvalue required as left operand of assignment" , biểu thức (2) không sinh ra lỗi, console hiển thị các giá trị a=b=c=d=1. Lý giải như sau : Trong C++ có 2 kiểu trả về là tham trị (value) và...

CẤU TRÚC DỮ LIỆU VÀ GIẢI THUẬT

Bài viết dựa trên cuốn sách "Cấu trúc dữ liệu và thuật toán" của thầy Nguyễn Đức Nghĩa - Đại học Bách Khoa Hà Nội. " Nhân cái ngày mà người người nhà nhà ôn thi như thế này, sau khi đọc hết cuốn sách, mình nghĩ sao không thử viết 1 cái blog, vừa để chia sẻ mà lại ôn tập " I. CÁC KHÁI NIỆM CƠ BẢN: Trong phần này chủ yếu nói đến các khái niệm về thuật toán và đánh giá. Định nghĩa:  Thuật toán là một dãy hữu hạn các bước để từ đầu vào thu được đầu ra mong muốn. Đánh giá thuật toán dựa trên 2 tiêu chí cơ bản là :  Tài nguyên máy tính Thời gian thực hiện (số phép toán thực hiện) => Sau đây chỉ nói về thời gian thực hiện:  Có 3 loại thời gian tính:  Thời gian tính tốt nhất (tiệm cận dưới) : loại này ít được quan tâm Thời gian tính trung bình  Thời gian tính tồi nhất (tiệm cận trên) : BIG-O  => Sau đây chỉ nói về Big-O:        Big O được hiểu là thời gian tính tồi nhất của một thuật toán (worst ca...

[Data Analysis] Data Pre-processing

Data Pre-processing or Data Cleaning or Data Wranging. Tiền xử lý dữ liệu luôn là một bước quan trọng trong các bài toán phân tích dữ liệu. Đây là bước chuyển đổi hoặc ánh xạ dữ liệu từ dạng khởi tạo ban đầu về các dạng chuẩn có thể xử lý được. Những bước cần thiết trong tiền xử lý dữ liệu: + Định nghĩa lại những giá trị bị thiếu (identify and handle missing value) + Định dạng lại dữ liệu (data formatting) + Chuẩn hóa dữ liệu (data normalize) + Data binning + Chuyển các nhãn phân loại về các biến kiểu số (turning categorical values to numberic variables) 1. Đối phó với dữ liệu bị thiếu trong python Các tập dữ liệu thường bị thiếu một vài trường thông tin ở các hàng, thường có giá trị ?, 0, N/A hoặc chỉ là null. Có nhiều cách để xử ký những giá trị này trong Python hoặc R như: + Hủy những giá trị thiếu: - Hủy hàng - Hủy cột + Thay thế bởi những giá trị khác: - Giá trị trung bình - Giá trị xuất hiện với tần số cao - Thay thế dựa trên 1 hàm tự tạo Thư viện Panda hỗ trợ ...