Kho dữ liệu dùng chung thành phố Đà Nẵng

Nhằm tận dụng hiệu quả tiềm năng của dữ liệu trong bối cảnh chuyển đổi số được triển khai trên mọi lĩnh vực, TP. Đà Nẵng đã xây dựng kho dữ liệu dùng chung phục vụ nhu cầu chia sẻ dữ liệu đã được chuẩn hóa, hỗ trợ hiệu quả cho công tác quản lý, điều hành, báo cáo và ra quyết định của lãnh đạo thành phố cũng như cung cấp nguồn dữ liệu mở cho người dân và doanh nghiệp.

A. TÓM TẮT KẾT QUẢ

Chuyển đổi số quan trọng nhất là kết nối dữ liệu. Kết nối cần vai trò của người điều phối, thúc đẩy, đồng hành, ở Trung ương là Bộ Thông tin và Truyền thông, ở địa phương là các Sở Thông tin và Truyền thông của tỉnh. 

Chuyển đổi số là sử dụng công nghệ số và dựa trên dữ liệu số. Tại Tp. Đà Nẵng, trong quá trình ứng dụng công nghệ thông tin (CNTT), triển khai chính quyền điện tử đã hình thành một số cơ sở dữ liệu. Tuy nhiên, cơ sở dữ liệu hiện có tồn tại rải rác, không đầy đủ, chưa đảm bảo chất lượng và tính duy nhất, không được chia sẻ để sử dụng chung cho toàn thành phố. Kho dữ liệu dùng chung được xây dựng để giải quyết vấn đề này, đồng thời thực hiện chức năng thu nhận ngay dữ liệu số của các ứng dụng xây mới, phát sinh mới để bảo đảm tập hợp, sử dụng dữ liệu số được quy củ trong thời gian đến.

Từ năm 2020, Tp. Đà Nẵng đã tiến hành nghiên cứu, hình thành nền tảng Kho dữ liệu dùng chung (Giai đoạn 1) tổng quát, linh hoạt, có khả năng thu nhận, hợp nhất dữ liệu đến từ nhiều nguồn, hỗ trợ làm sạch, chuẩn hóa dữ liệu để phân tích, xử lý dữ liệu lớn, ra quyết định dựa trên dữ liệu; cũng như là đầu mối duy nhất chia sẻ dữ liệu cho các cơ quan khác khai thác, sử dụng, cung cấp dữ liệu mở cho người dân và doanh nghiệp.

Kết quả đạt được đến nay như sau:

Đã tích hợp về Kho dữ liệu dùng chung gồm 9 nguồn dữ liệu: CSDL công dân; CSDL nhân, hộ khẩu; CSDL doanh nghiệp; CSDL bảo hiểm xã hội; CSDL cấp phép xây dựng; CSDL cấp phép lái xe; CSDL du lịch; CSDL đất đai; CSDL môi trường. Chi tiết: 112 bảng dữ liệu; 1.149 trường dữ liệu; 7.669.915 bản ghi. Đã xây dựng 58 chuẩn, 252 quy tắc dữ liệu (ví dụ: CMND/CCCD chỉ có 9 số hoặc 12 số; mã quốc gia theo TCVN 7217-1: 2007; mã đơn vị hành chính theo quy chuẩn 124/2004/QĐ-TTg;...). Thông qua bộ lọc dữ liệu; đã phát hiện khoảng 10% bản ghi dữ liệu không đáp ứng quy tắc dữ liệu. Sở Thông tin và Truyền thông đã phối hợp với các cơ quan chủ quản nguồn dữ liệu để làm sạch dữ liệu và đưa vào Kho dữ liệu chuẩn hóa.

Trên cơ sở Kho dữ liệu được làm sạch, chuẩn hóa, các cơ quan, địa phương đã tích cực khai thác, sử dụng để cung cấp dịch vụ số, tạo ra giá trị mới.

Thành phố Đà Nẵng đã triển khai thí điểm sử dụng dữ liệu điện tử (CSDL đất đai, CSDL nhân hộ khẩu, CSDL doanh nghiệp) để thay thế thành phần hồ sơ thủ tục hành chính phải nộp tại hầu hết các sở, ngành có liên quan và UBND cấp quận, phường.

Thành phố Đà Nẵng cũng đã phân tích, khai thác, sử dụng dữ liệu phục vụ công tác phòng chống dịch COVID-19 chủ động, hiệu quả như khai thác CSDL bảo hiểm xã hội, CSDL doanh nghiệp để cấp Giấy đi đường QRCode; phân tích dữ liệu khai báo y tế để biết, cảnh báo sớm người có nguy cơ (ho, sốt, người về từ vùng dịch, tiếp xúc với F0)...

Từ Kho dữ liệu, đã hỗ trợ phân tích dữ liệu kinh tế - xã hội phục vụ công tác chỉ đạo, điều hành, ra quyết định của lãnh đạo thành phố, đặc biệt là trong phòng, chống dịch COVID-19 vừa qua. Từ đó góp phần nâng cao sự tin tưởng của lãnh đạo các cấp địa phương về tính hiệu quả của dữ liệu số, tạo thói quen xây dựng và chia sẻ dữ liệu số giữa các cơ quan, đơn vị.

Từ Kho dữ liệu, thành phố Đà Nẵng đã mở dữ liệu của cơ quan nhà nước; đến nay đã cung cấp gần 600 dữ liệu mở cho người dân, doanh nghiệp khai thác thông qua API, SMS, Zalo, web.

Hình 1: Giao diện Hệ thống Kho dữ liệu dùng chung thành phố Đà Nẵng

Hình 1: Giao diện Hệ thống Kho dữ liệu dùng chung Tp. Đà Nẵng

Kho dữ liệu dùng chung (tại địa chỉ https://khodulieu.danang.gov.vn) là một trong những hợp phần của Nền tảng đô thị thông minh (Smart City Platform) theo hướng dẫn của Bộ Thông tin và Truyền thông tại Công văn số 4176/BTTTT-THH ngày 22/11/2019. Hiện nay, Kho dữ liệu dùng chung (Giai đoạn 1) áp dụng đối với dữ liệu có cấu trúc, đang tiếp tục mở rộng để áp dụng với dữ liệu phi/bán cấu trúc.

B. CÁCH LÀM ĐI ĐẾN KẾT QUẢ

1. Sự cần thiết

Với sự xuất hiện của hàng triệu thiết bị thông minh như điện thoại di động, camera, cảm biến..., dữ liệu sinh ra ngày càng phức tạp, khối lượng dữ liệu lớn, tốc độ tăng trưởng nhanh, yêu cầu xử lý theo thời gian thực, đa dạng về chủng loại gồm có cấu trúc, bán cấu trúc, phi cấu trúc. Sự phức tạp này khiến cho các phần mềm quản lý dữ liệu và báo cáo nghiệp vụ thông thường không còn phù hợp với dữ liệu lớn.

Tại thành phố Đà Nẵng, dữ liệu còn cát cứ, rời rạc, chưa được tích hợp, quản lý thống nhất để hỗ trợ việc ra quyết định. Nỗ lực triển khai trục tích hợp dữ liệu và các dịch vụ dữ liệu cũng chỉ giải quyết được vấn đề cung cấp dữ liệu đơn lẻ. Sự thiếu sót và thiếu tính chuẩn xác, sự sai lệch, không khớp nhau về lược đồ dữ liệu (data schema), không toàn diện về dữ liệu khiến cho việc sử dụng dữ liệu hợp nhất từ nhiều nguồn gặp khó khăn.

Đây cũng là vấn đề mà thế giới đang tập trung giải quyết.

Giải pháp phù hợp cho vấn đề nêu trên là xây dựng một nền tảng dữ liệu (Data platform) tổng quát, linh hoạt có khả năng thu nhận, hợp nhất, chuẩn hóa dữ liệu đến từ nhiều nguồn, hỗ trợ lưu trữ, phân tích, xử lý dữ liệu lớn.

Do đó, để đảm bảo triển khai hiệu quả thành phố thông minh, thành phố Đà Nẵng đã phát triển nền tảng Kho dữ liệu dùng chung nhằm hỗ trợ lãnh đạo thành phố ra quyết định chính xác, tối ưu, cung cấp tri thức, hiểu biết về quá trình hoạt động của đô thị, dự báo sự phát triển kinh tế - xã hội thành phố.

Việc xây dựng nền tảng kho dữ liệu dùng chung thành phố Đà Nẵng là một trong những nhiệm vụ quan trọng, cấp thiết và phù hợp với xu hướng chuyển đổi số, xây dựng thành phố thông minh hiện nay của Trung ương và thành phố.

2. Mục đích, yêu cầu

Hình thành nền tảng Kho dữ liệu dùng chung có khả năng xử lý đa dạng các loại dữ liệu (có cấu trúc, bán cấu trúc, phi cấu trúc), hợp nhất dữ liệu từ nhiều nguồn dữ liệu khác nhau, làm sạch, chuẩn hóa phục vụ khai phá, phân tích dữ liệu lớn, hỗ trợ ra quyết định dựa trên dữ liệu, sử dụng dữ liệu để tạo ra giá trị mới, phát triển các sản phẩm/dịch vụ mới.

3. Giải pháp

3.1 Quy trình xử lý dữ liệu

Nền tảng Kho dữ liệu dùng chung thành phố Đà Nẵng gồm các thành phần lõi sau đây (được phân tích, thiết kế, và hoàn toàn làm chủ về công nghệ):

ETL (Extract-Transform-Load): Tự phát triển công cụ ETL đảm bảo khả năng xử lý đa dạng các loại dữ liệu. Data Lineage - lưu vết nguồn gốc dữ liệu: Lập hồ sơ về nguồn dữ liệu được thu nhận và ánh xạ từ dữ liệu nguồn đến dữ liệu trong hệ thống. Data Governance - quản lý các luồng thu nhận dữ liệu cũng như dữ liệu đã được thu nhận vào hệ thống. Dữ liệu tồn tại trong hệ thống được phân làm 2 loại: (1) dữ liệu không hợp chuẩn, được lưu ở kho chứa DQS (Data Quality Storage) và (2) dữ liệu đã chuẩn hóa (Normalized Data Storage). Data Firewall - áp dụng các quy tắc kiểm tra tính hợp chuẩn của dữ liệu. Các quy tắc kiểm tra tính hợp chuẩn của dữ liệu được xây dựng dựa trên tập hợp các tiêu chuẩn cho các loại trường dữ liệu. Data Flow Designer - định nghĩa luồng thu nhận dữ liệu, cho phép người dùng lựa chọn nguồn dữ liệu, đích đến của dữ liệu khi thu nhận vào hệ thống, xây dựng các biểu thức chuyển đổi ánh xạ dữ liệu đầu vào, thiết lập các tiêu chí đánh giá khả năng trùng lặp dữ liệu. Data Flow Executor - thực thi luồng thu nhận dữ liệu: hợp nhất dữ liệu, kiểm tra tính trùng lặp dữ liệu, kiểm tra tính bảo toàn tham chiếu dữ liệu trước khi lưu vào hệ thống. Quá trình thực thi được ghi nhật ký để có thể truy vết khi cần.

Hình 2: Quy trình xử lý dữ liệu

Hình 2: Quy trình xử lý dữ liệu

3.2 Mô hình tổng thể nền tảng kho dữ liệu dùng chung Tp. Đà Nẵng

Nền tảng kho dữ liệu dùng chung xây dựng theo kiến trúc micro-service, kiến trúc hướng dịch vụ (SOA); có tính mô-đun hóa (modularity) đảm bảo khả năng phân tách thành các phân hệ để thuận lợi trong quản lý kiến trúc hệ thống; dựa trên các tiêu chuẩn mở (Open standards) hỗ trợ đơn giản hóa việc tích hợp với các nền tảng và hệ thống khác; có khả năng chịu lỗi (Fault-tolerance), có khả năng mở rộng mà không phải thay đổi kiến trúc hệ thống; đảm bảo hiệu năng cao với cơ chế hoạt động song song, đa luồng trong môi trường phân tán, truy xuất dữ liệu nhanh khi dữ liệu ngày càng lớn theo thời gian, đảm bảo số lượng giao dịch nhiều người cùng lúc.

Tùy theo mức độ, quy mô dữ liệu của thành phố, hệ thống có thể được nâng cấp hạ tầng phần cứng một cách linh hoạt.

Hình 3: Mô hình tổng thể Kho dữ liệu dùng chung thành phố Đà Nẵng

Hình 3: Mô hình tổng thể Kho dữ liệu dùng chung Tp. Đà Nẵng

3.3 Chức năng hệ thống

Nền tảng Kho dữ liệu dùng chung là hệ thống cho phép thu thập, trích xuất, chuyển đổi, làm sạch, chuẩn hóa, lưu trữ, quản lý; từ đó phục vụ triển khai Chính quyền điện tử, chính quyền số, thành phố thông minh: Chia sẻ dữ liệu, dùng chung cho các ứng dụng của các cơ quan nhà nước; Cung cấp dữ liệu cho Cổng dữ liệu mở thành phố (https://congdulieu.vn hoặc https://opendata.danang.gov.vn) để công khai thông tin, chia sẻ dữ liệu cho người dân, cho doanh nghiệp hỗ trợ khởi nghiệp, sáng tạo; Cung cấp dữ liệu để phân tích, xử lý, khai phá và hỗ trợ ra quyết định;… Một số điểm nổi bật của Kho dữ liệu thành phố Đà Nẵng như sau: Dựa trên công cụ ETL (Extract-Transform-Load) tự phát triển. Làm việc với đa dạng loại dữ liệu (có cấu trúc, bán cấu trúc, phi cấu trúc) đến từ nhiều nguồn khác nhau (excel, CSV, dữ liệu camera, mạng xã hội, logfile, thiết bị IoT, dữ liệu GIS...). Cho phép định nghĩa tùy biến luồng thu nhận, kiểm tra, hợp nhất và chuẩn hóa dữ liệu một cách linh hoạt. Cung cấp cơ chế "tường lửa dữ liệu" (Data Firewall) giúp lọc dữ liệu không hợp chuẩn, cho phép người quản trị dữ liệu thực hiện chuẩn hóa. Tường lửa dữ liệu đóng vai trò là bộ lọc tùy biến được cho từng luồng thu nhận dữ liệu cụ thể. Cho phép người dùng tinh chỉnh tham số để phát hiện sự trùng lặp dữ liệu trong quá trình thu nhận. Cung cấp các cơ chế xử lý dữ liệu song song (parallel processing), xử lý theo lô (batch processing), xử lý theo thời gian thực (streaming processing). Cung cấp các cơ chế quản trị dữ liệu (Data Governance), kiểm soát dữ liệu và siêu dữ liệu nhằm đảm bảo luôn chứa các dữ liệu sạch và chuẩn hóa: Quản lý siêu dữ liệu (Metadata); Quản lý danh mục dữ liệu (Data Catalog); Quản lý chất lượng dữ liệu (Data Quality), hỗ trợ việc định nghĩa các quy tắc chất lượng dữ liệu (rules and standards), cung cấp cơ chế làm sạch (cleaning) và hiệu chuẩn (transformation and standardization) dựa trên các quy tắc chất lượng dữ liệu; Quản lý vòng đời của dữ liệu; Quản lý nguồn dữ liệu (Data Lineage); Bảo mật dữ liệu (Data Security). Tích hợp với Trục tích hợp liên thông thành phố LGSP, Hệ thống thông tin Chính quyền điện tử thành phố Đà Nẵng; sẵn sàng kết nối với Nền tảng tích hợp chia sẻ quốc gia (NDXP)... Cung cấp dịch vụ chia sẻ dữ liệu (bao gồm dữ liệu thô, dữ liệu chuẩn hóa, dữ liệu phân tích) cho Trung tâm Giám sát điều hành thông minh và các hệ thống ứng dụng khác.

3.4 Công nghệ sử dụng

Hệ thống sử dụng các công nghệ Dữ liệu Lớn (Big Data) để xây dựng và quản lý Hồ dữ liệu (Data Lake) cho phép thu nhận, xử lý hợp nhất dữ liệu. Sử dụng các công cụ phân tích xử lý dữ liệu lớn mã nguồn mở như Kafka, Hadoop, Hive, Spark ... hiệu chỉnh, khớp nối tạo thành hệ thống nền tảng dữ liệu toàn diện.

3.5 Khả năng kết nối, hỗ trợ tới các nền tảng và hệ sinh thái liên quan

Thành phố Đà Nẵng đã xây dựng Trục tích hợp liên thông LGSP và kết nối, tích hợp với Trục liên thông quốc gia NGSP. Theo Khung kiến trúc chính quyền điện tử và thành phố thông minh của thành phố Đà Nẵng, Kho dữ liệu đã kết nối với Trục liên thông LGSP để kết nối đến các CSDL nền (công dân, doanh nghiệp, nhân hộ khẩu, đất đai) và các CSDL chuyên ngành của các sở, ban, ngành, quận huyện nhằm thu thập dữ liệu. Đồng thời, sẵn sàng kết nối, tích hợp với Nền tảng tích hợp chia sẻ dữ liệu quốc gia NDXP và Trục liên thông quốc gia NGSP để thu nhận dữ liệu từ các CSDL quốc gia và CSDL Bộ, ngành Trung ương.

Tp. Đà Nẵng đã xây dựng Cổng dữ liệu mở (opendata.danang.gov.vn hoặc congdulieu.vn) nhằm cung cấp các tập dữ liệu mở qua nhiều kênh tra cứu, khai thác như web, API, SMS, Zalo phục vụ các tổ chức, cá nhân khai thác, sử dụng. Kho dữ liệu đã kết nối với Cổng dữ liệu mở, qua đó cho phép mở dữ liệu từ các cơ quan thành phố (từ các CSDL nền và chuyên ngành) đưa lên Cổng dữ liệu mở để công khai ra bên ngoài.

Thành phố Đà Nẵng đang hình thành Trung tâm Giám sát điều hành thông minh (IOC) và nền tảng phân tích dữ liệu thông minh (Artificial Intelligence Platform). Kho dữ liệu là một trong những hợp phần của Hệ thống Nền tảng thành phố thông minh (Smart City Platform), cung cấp toàn bộ dữ liệu cho Trung tâm IOC để trình diễn, hiển thị; đồng thời cung cấp dữ liệu cho nền tảng phân tích dữ liệu để phục vụ khai phá, phân tích thông minh.

3.6 Tính bảo mật và quyền riêng tư

Hệ thống đã xây dựng sẵn sàng phân hệ Bảo mật dữ liệu (Data Security) nhằm quản lý, đảm bảo tính toàn vẹn dữ liệu và đảm bảo rằng dữ liệu không thể truy cập được bởi các bên trái phép và làm hỏng dữ liệu. Bảo mật dữ liệu bao gồm mã hóa dữ liệu, mã thông báo và quản lý khóa bảo vệ dữ liệu trên tất cả các ứng dụng và nền tảng. Hệ thống sử dụng chức năng xác thực tập trung và đăng nhập một lần của Hệ thống thông tin Chính quyền điện tử thành phố.

Hệ thống đảm bảo khả năng phân quyền truy cập đến từng bảng, trường dữ liệu. Mọi hành động truy cập, đọc/ghi, thêm mới, sửa đổi, hủy bỏ,.. đều được ghi lại nhật ký và cung cấp giao diện trực quan để người quản trị kiểm soát.

Áp dụng các tiêu chuẩn bảo mật cũng như các kỹ thuật nhằm đảm bảo tính bảo mật cho các hệ thống, tránh các lỗi bảo mật có thể phát sinh như SQL Injection, XSS, CSR.

Kiểm thử mã nguồn, ứng dụng trong quá trình phát triển và trước khi đưa vào sử dụng.

Xây dựng phương án phòng chống DDOS ngay từ đầu như: Áp dụng proxy vào kiến trúc ứng dụng; sử dụng

Tường lửa để lọc các truy cập; áp dụng biện pháp chống DDOS ở tầng lập trình.

Sử dụng giao thức https và xác thực người dùng khi sử dụng hệ thống.

Thiết kế hệ thống theo hướng phân tán, tách biệt hệ thống quản trị dữ liệu và lưu trữ dữ liệu.

Thiết lập các tường lửa và hạn chế các cổng truy xuất vào CSDL. 

Xây dựng cơ chế giám sát thay đổi và thông tin cho người quản trị.

Giám sát tình trạng vận hành hệ thống (Server, RAM, Storage).

Định kỳ sao lưu dữ liệu dự phòng.

Hệ thống được cài đặt tại Trung tâm dữ liệu thành phố Đà Nẵng, do đó kế thừa các giải pháp bảo đảm an toàn thông tin chuyên dụng như Tường lửa External/Internal, thiết bị phát hiện và phòng chống xâm nhập trái phép (IPS/IDS), thiết bị cân bằng tải, hệ thống giám sát an toàn thông tin tập trung (SIEM),...

3.7 Sự ổn định và độ tin cậy

Chất lượng dữ liệu thu nhận vào hệ thống được giám sát, quản lý và đảm bảo thông qua: (1) hệ thống chuẩn ràng buộc dữ liệu được định nghĩa rõ ràng, (2) các tiêu chí đánh giá độ trùng lặp dữ liệu được người dùng thiết lập, tinh chỉnh cụ thể, (3) quá trình chuẩn hóa dữ liệu bằng tay hoặc tự động đều được lưu vết. Chính vì vậy, chất lượng dữ liệu luôn được đảm bảo.

Luồng thu nhận dữ liệu được lập hồ sơ quản lý. Quá trình thực thi của luồng thu nhận dữ liệu được theo dõi, ghi nhật ký, qua đó bảo đảm được tính rõ ràng và tin cậy về nguồn gốc dữ liệu.

Dữ liệu của hệ thống, ngoài việc có thể sao lưu-phục hồi còn được đánh phiên bản.

Các thành phần lõi được phân tích, thiết kế, cài đặt và làm chủ hoàn toàn nên hệ thống có khả năng bảo hành, bảo trì cao và dễ dàng mở rộng, phát triển

3.8 Khả năng tùy biến, mở rộng

Hệ thống xây dựng theo hướng lập trình tùy biến các chức năng hiện tại. Một số chức năng trong hệ thống có thể được mở rộng bởi người dùng chuyên nghiệp thông qua việc cung cấp các đoạn mã lập trình thêm bao gồm

Bổ sung các hàm chuyển đổi dữ liệu (Transformation function) trong công đoạn định nghĩa luồng thu nhận dữ liệu Bổ sung ràng buộc cho các kiểu dữ liệu, định nghĩa các quy tắc áp dụng ràng buộc cho kiểu dữ liệu để phù hợp với yêu cầu của cơ quan, đơn vị. Hệ thống có thể được tùy biến để phù hợp với quy mô dữ liệu cũng như tính chất, hoạt động nghiệp vụ của các cơ quan, đơn vị: Về hạ tầng phần cứng, số lượng máy trong cụm máy chủ dữ liệu, máy chủ ứng dụng có thể được tùy biến. Chức năng chính của hệ thống - thực thi luồng thu nhận dữ liệu - có thể được lập lịch linh hoạt đáp ứng với nhu cầu thực tế của các cơ quan.

Hệ thống có khả năng mở rộng mà không phải thay đổi kiến trúc hệ thống; đảm bảo hiệu năng cao với cơ chế hoạt động song song, đa luồng trong môi trường phân tán, truy xuất dữ liệu nhanh khi dữ liệu ngày càng lớn theo thời gian, đảm bảo số lượng giao dịch nhiều người cùng lúc.

4. Tổ chức triển khai

4.1 Về chính sách:

Sở Thông tin và Truyền thông là cơ quan chủ trì tham mưu cho UBND thành phố ban hành Quy chế chia sẻ dữ liệu số trên địa bàn thành phố tại Quyết định số 846/QĐ-UBND ngày 21/02/2019 (trước khi Chính phủ ban hành Nghị định số 47/2020/NĐ-CP) xác định rõ các danh mục dữ liệu dùng chung; trách nhiệm của cơ quan chủ quản dữ liệu, quản lý, cập nhật, chia sẻ, sử dụng, khai thác dữ liệu.

Sở Thông tin và Truyền thông chủ trì ban hành các văn bản gửi các cơ quan, địa phương trên địa bàn thành phố chia sẻ các cơ sở dữ liệu chuyên ngành thuộc phạm vi quản lý về Kho dữ liệu dùng chung thành phố; tổ chức tập huấn, hướng dẫn sử dụng.

Tham mưu khung hướng dẫn triển khai xây dựng, tiếp nhận các ứng dụng mới phải có hợp phần tạo, cập nhật dữ liệu số; đặc biệt là kết nối, chia sẻ dữ liệu về Kho dữ liệu dùng chung của Thành phố.

4.2 Về truyền thông:

Quảng bá qua các kênh truyền thông điện tử của thành phố Đà Nẵng: qua kênh thoại, tin nhắn, fanpage mạng xã hội, chatbot, Zalo của Tổng đài 1022; Cổng Thông tin điện tử thành phố, các trang thông tin điện tử của các sở, ngành, địa phương trên địa bàn thành phố.

Thường xuyên giới thiệu Kho dữ liệu dùng chung tại các hội nghị, hội thảo quốc tế và trong nước về xây dựng thành phố thông minh, chuyển đổi số …

5. Tồn tại, hạn chế

Các CSDL quốc gia về dân cư, đất đai chưa được chia sẻ cho các địa phương để hình thành dữ liệu nền/dữ liệu tham chiếu.

Các cơ quan Trung ương như Công an, Thuế, Thống kê,... chưa thực hiện chia sẻ dữ liệu cho các địa phương do vướng các quy định pháp luật chuyên ngành trái với quy định tại Nghị định số 47/2020/NĐ-CP ngày 09/4/2020 của Chính phủ. Do vậy các cơ quan trên chờ sửa đổi Luật chuyên ngành mới triển khai chia sẻ dữ liệu.

Các Bộ, ngành Trung ương chưa ban hành các chuẩn dữ liệu để phục vụ kết nối, chia sẻ. Các CSDL chuyên ngành của thành phố triển khai, hình thành trong quá trình hoạt động chưa được thu thập đầy đủ, không chất lượng, chuẩn hóa. Do đó tính khả dụng của dữ liệu thấp, cần có thời gian rà soát, hoàn thiện.

6. Bài học kinh nghiệm

Thống nhất về nguyên tắc, quan điểm chỉ đạo (trong các văn bản liên quan của Thành ủy, UBND thành phố): Dữ liệu được tạo ra trong quá trình hoạt động của cơ quan nhà nước là tài sản thuộc sở hữu của nhà nước, không phải của riêng cơ quan/cá nhân nào. Do đó, dữ liệu phải được chia sẻ, sử dụng chung giữa các cơ quan nhà nước.

Xây dựng Kiến trúc dữ liệu làm định hướng, kim chỉ nam cho xây dựng, tạo lập, kết nối, chia sẻ, khai thác dữ liệu của thành phố. Kiến trúc dữ liệu của thành phố đảm bảo phù hợp với Kiến trúc dữ liệu quốc gia và Kiến trúc dữ liệu của các bộ, ngành, địa phương.

Phải ban hành trước Quy chế chia sẻ dữ liệu số trên địa bàn thành phố.

Xây dựng Kho dữ liệu dùng chung phân kỳ nhiều giai đoạn để kịp thời sử dụng, tiếp tục mở rộng, hoàn thiện; không cầu toàn, triển khai quy mô quá lớn.

Các ứng dụng mới phải có hợp phần tạo, cập nhật dữ liệu số; đặc biệt là kết nối, chia sẻ dữ liệu về Kho dữ liệu dùng chung của Thành phố; chú trọng việc ban hành quy chế vận hành, cập nhật dữ liệu cho ứng dụng đó để bảo đảm dữ liệu luôn được đầy đủ, chất lượng và duy nhất; bảo đảm cho chia sẻ và sử dụng dữ liệu.

Lấy người dân, doanh nghiệp làm trung tâm, chủ thể phục vụ; thường xuyên rà soát, đánh giá chất lượng dữ liệu và tình hình sử dụng, tái cấu trúc quy trình để sử dụng hiệu quả hoặc kế thừa dữ liệu số, xem việc cung cấp dịch vụ số cho người dân, doanh nghiệp là một kết quả, đầu ra, là "giá trị" của dữ liệu số.

Bài viết mới nhất

Phổ cập tên miền quốc gia .vn để phát triển kinh tế số và xã hội số
Thư viện sách số