SBT Tin học 10 Kết nối tri thức Bài 3: Một số kiểu dữ liệu và dữ liệu văn bản

623

Toptailieu biên soạn và giới thiệu giải sách bài tập Tin học 10 trang 9 Bài 3: Một số kiểu dữ liệu và dữ liệu văn bản Sách bài tập Tin học 10 Kết nối tri thức hay nhất, chi tiết sẽ giúp học sinh dễ dàng làm các bài tập từ đó nâng cao kiến thức và biết cách vận dụng phương pháp giải vào các bài tập trong SBT Tin học 10 Bài 3.

Sách bài tập Tin học 10 Bài 3 (Kết nối tri thức): Một số kiểu dữ liệu và dữ liệu văn bản

Câu 3.1 trang 9 SBT Tin học 10: Việc phân loại các kiểu dữ liệu căn cứ chủ yếu vào tiêu chí nào?

A. Cách mã hoá. 

B. Cùng chung các phép xử lí dữ liệu cơ bản. 

C. Cả A và B đều đúng.

D. Cả A và B đều sai.

Lời giải:

Đáp án đúng là: B

Về cơ bản theo phép toán xử lí dữ liệu. Dữ liệu được mã hoá thống nhất để có thể xây dựng các phép xử lí trên cơ sở mã hoá. Việc mã hoá có mục đích thống nhất và tạo thuận lợi cho xử lí.

Câu 3.2 trang 9 SBT Tin học 10: Kể ra 10 tên dữ liệu có trong học bạ có các kiểu văn bản, hình ảnh, số nguyên và số thập phân.

Lời giải:

Một số ví dụ dữ liệu trong học bạ và kiểu của chúng:

- Kiểu văn bản: họ và tên, địa chỉ, tên trường.

- Kiểu số nguyên: ngày, tháng, năm sinh.

 

- Kiểu số có phần lẻ (phần thập phân): điểm trung bình môn.

- Kiểu ảnh: ảnh học sinh, dấu của trường, chữ kí của giáo viên. 

Câu 3.3 trang 9 SBT Tin học 10: Ngày nay mã QR (QR code) được sử dụng rất rộng rãi. Đây là mã hoá của xâu kí tự, có thể giải mã được bằng các ứng dụng đọc QR code, tải từ "chợ ứng dụng" xuống điện thoại thông minh. Ví dụ Hình 3.1 là mã QR của chuỗi kí tự http://en.m.wikipedia.org. Kiểu dữ liệu của QR Code thuộc loại gì? hình ảnh hay xâu kí tự?

 (ảnh 1)

Lời giải:

Kiểu dữ liệu của QR code thuộc loại hình ảnh, nó được xử lí ban đầu với vai trò là hình ảnh, từ đó mới ra xâu kí tự.

Câu 3.4 trang 9 SBT Tin học 10: Em hãy tìm mã nhị phân và mã thập phân (số thứ tự của kí tự trong bảng mã ASCII) của các kí tự trong từ Computer.

Lời giải:

Biểu diễn của xâu kí tự "Computer" trong bảng mã ASCII mở rộng:

01000011 01101111 01101101 01110000 01110101 01110100 01100101 01110010

Câu 3.5 trang 9 SBT Tin học 10: Tìm hiểu 32 kí tự đầu tiên của bảng mã ASCII theo những gợi ý sau:

- Chúng được sử dụng với mục đích gì?

- Các kí tự đó có "mặt chữ" không? Hình ảnh trong ô là các kí tự Latinh (Ví dụ EOT, CR, ...) có phải là "mặt chữ" không?

Lời giải:

- Trong bảng mã ASCII, 32 kí tự đầu tiên là các mã điều khiển. Chúng không được gán mặt chữ. Chúng có tên riêng theo chức năng của mình. Ví dụ kí tự số 10 LF (line feet) sẽ chuyển con trỏ văn bản xuống dòng mới, còn kí tự số 13 CR (carriage return) sẽ đưa con trỏ về đầu dòng. Khi soạn thảo văn bản mà ta nhấn phím thì phần mềm soạn thảo sẽ tự động chèn cả 2 kí tự này vào văn bản mà chúng ta không nhìn thấy vì chúng không có ảnh. Kết quả là khi nhấn Enter em thấy con trỏ văn bản chuyển về đầu dòng mới.

 

- Nếu dùng mã điều khiển để làm mã kí tự thì phải gán mặt chữ cho nó. Ví dụ bộ mã tiếng Việt TCVN/5712:1993, còn gọi là bộ mã VSCII đã làm như vậy. Tuy nhiên việc lạm dụng có thể gây những hiệu ứng sai lệch. Ví dụ mã số 2 là STX (Start of Text) là mã báo bắt đầu truyền từ chữ tiếp theo cho đến khi gặp mã số 4 EOT (End of Text) thì ngừng truyền. Trong bảng mã VSCII dùng mã số 2 cho "Ụ", còn mã số 4 cho "Ừ", nên nếu truyền đi một dòng chữ có 2 kí tự Việt này, một số phần mềm sẽ hiểu sai.

Câu 3.6 trang 9 SBT Tin học 10: Với 134 kí tự riêng phát sinh so với bảng chữ cái tiếng Anh, hoàn toàn có khả năng sắp xếp trong bảng chữ 8 bit với 256 kí tự. Theo em, tại sao Việt Nam vẫn cần sử dụng bảng mã Unicode?

Lời giải:

Mặc dù có thể xếp toàn bộ chữ Việt trong bảng 256 vị trí nhưng vẫn cần sử dụng Unicode Vì các lí do sau:

- Phải lấy thêm chỗ ở vùng mã điều khiển, có thể gây ra các bất cập như ví dụ câu 3.5.

- Thống nhất kí tự Việt trong tổng thể các kí tự chung của toàn thế giới, đặc biệt chúng ta luôn có nhu cầu sử dụng nhiều ngôn ngữ trong cùng một ứng dụng.

Câu 3.7 trang 9 SBT Tin học 10: Unicode mã hoá mỗi kí tự bởi

A. 1 byte.

B. 2 byte

C. 4 byte.

D. Từ 1 đến 4 byte.

Lời giải:

Đáp án đúng là: D

UTF-8 là một trong các hệ thống định dạng chuyển đổi cho phép mã hóa kí tự với độ dài khác nhau (từ 1 byte đến 4 byte) dành cho Unicode.

Câu 3.8 trang 9 SBT Tin học 10: Unicode đủ mã cho bộ chữ toàn cầu. Tại sao người ta lại dùng UTF?

Lời giải:

- Khi có Unicode, đã có rất nhiều ứng dụng sử dụng các loại mã khác, đặc biệt là ASCII 8 bit. Các ứng dụng xử lí văn bản như thư điện tử, soạn thảo, cơ sở dữ liệu dùng với ASCII và một số bảng mã khác đã tồn tại từ trước đó để lại một khối lượng dữ liệu khổng lồ, không thể vứt bỏ. Việc sửa các phần mềm chỉ sử dụng Unicode có nghĩa là sẽ mất rất nhiều dữ liệu. Mặt khác, khi dùng Unicode thì khối lượng lưu trữ cho dữ liệu văn bản sẽ tăng hơn hai lần.

- Vì thế cần có một cách mã hoá đồng thời Unicode và một số bảng mã khác, đặc biệt là ASCII để có thể sử dụng được các dữ liệu cũ và không nhất thiết phải dùng mã nhiều byte trong các ứng dụng phổ biến để tiết kiệm lưu trữ.

- UTF là cách giải quyết các yêu cầu trên. Vì thế UTF cũng được coi là đối tượng của Unicode (Unicode Transformation Format).

Xem thêm lời giải vở bài tập Tin học lớp 10 Kết nối tri thức hay, chi tiết khác:

Bài 2: Vai trò của thiết bị thông minh và tin học đối với xã hội

Bài 4: Hệ nhị phân và dữ liệu số nguyên

Bài 5: Dữ liệu lôgic

Bài 6: Dữ liệu âm thanh và hình ảnh

Bài 7: Thực hành sử dụng thiết bị số thông dụng

Từ khóa :
Giải bài tập
Đánh giá

0

0 đánh giá