Ngày 29/3/2021, tại phòng 313 A4, đã diễn ra: HỘI THẢO CHUYÊN ĐỀ KHOA CÔNG NGHỆ THÔNG TIN – LẦN 2
Với chủ đề: “Công nghệ thông tin – thực trạng và xu thế công nghệ mới” 
Tham dự hội thảo có: Thầy TS. Nguyễn Trung Đức - Phó Khoa CNTT.
Cô: Lê Thị Hiền  Đại diện Phòng Khoa Học Công nghệ 
cùng các thầy cô giảng viên Khoa CNTT

Hội thảo đã thảo luận về các vấn đề khoa học công nghệ trong lĩnh vực CNTT

Đề tài 1: Khai phá Quan điểm mức câu bằng Co-training.

Thử nghiệm mô hình khai phá quan điểm (KPQĐ) mức câu dùng thuật toán học bán giám sát Co-training dựa trên việc phân chia khung nhìn (view) và tập dữ liệu MPQA2.0. Co-training là một thuật toán học máy bán giám sát dùng hai bộ phân lớp thành phần “yếu” cùng với lượng khá nhỏ dữ liệu có nhãn và lượng lớn dữ liệu không nhãn. Để có được mô hình dựa trên Co-training hoàn chỉnh, kĩ thuật phân lớp SVM được chọn làm các bộ phân lớp thành phần do đã được một số nghiên cứu chứng minh là có hiệu quả nhất đối với bài toán KPQĐ. Các tham số tối ưu của SVM cùng với hai đặc trưng “tốt nhất” làm hai khung nhìn được xác định qua một số thực nghiệm. Số lượng mẫu không nhãn được các bộ phân lớp nhận ra sau mỗi lần lặp (p, n) được thiết lập dựa trên số lượng và tỉ lệ của các nhãn đầu ra trong tập dữ liệu huấn luyện, kiểm tra. Sau cùng, các thực nghiệm trên các tập huấn luyện với tỉ lệ có nhãn / không nhãn khác nhau được tiến hành rồi so sánh với kết quả của học có giám sát trên cùng tập kiểm tra nhằm minh chứng cho tính hiệu quả của mô hình

Đề tài 2: Xây dựng rô bốt kiểm tra, giám sát môi trường trong két nước dằn tàu biển.

Robot là một giải pháp khả thi và tiện lợi cho kiểm tra, giám sát và thậm chí có thể sử dụng để làm sach, sửa chữa các két nước dằn trên tàu biển. Robot giúp tăng tốc "hải trình" và giảm rủi ro cho sức khỏe các sĩ quan. Trong bài báo này, nhóm tác giả đề xuất một giải pháp xây dựng rô bốt kiểm tra, giám sát môi trường trong két. Tiến hành thử nghiệm rô bốt đã xây dựng trong môi trường thực nhằm khẳng định tính khả thi của phương pháp pháp. Kết quả chỉ ra rằng giải pháp này có thể ứng dụng trong thực tế.

Đề tài 3. Nghiên cứu nhúng từ cho bài toán phân loại văn bản.

Bài báo này trình bày tổng quan cơ chế mã hóa nhúng từ (Word embedding) và hai giải thuật nhúng từ tiêu biểu bao gồm Cbow và Skip-gram. So sánh với biểu diễn One-hot, nhúng từ giảm bớt sự lãng phí bộ nhớ. Hơn nữa, biểu diễn này còn thể hiện được mối liên hệ ngữ nghĩa giữa các từ trong ngữ cảnh của câu văn. Dựa trên mã hóa nhúng từ, tác giả ứng dụng mô hình mạng nơ ron hồi quy giải quyết bài toán phân loại văn bản. Bài báo thử nghiệm các kết quả của mô hình này, và so sánh chúng với các kết quả của mạng nơ ron thông thường cũng như Transformer. Kết quả thử nghiệm cho thấy các mô hình nhúng từ cho độ chính xác phân loại cao trên tập kiểm thử.

Đề tài 4. Thực trạng an ninh dữ liệu của doanh nghiệp và đề xuất một số giải pháp khắc phục.

Hiện nay, an toàn dữ liệu của doanh nghiệp đang là vấn đề quan quan rất nhiều không chỉ trong nước mà cả quốc tế. Việc cơ sở dữ liệu (CSDL) của doanh nghiệp mất an toàn, để nhiều lỗ hổng sẽ là cơ hội để cho các hacker khai thác. Thực tế nhiều doanh nghiệp trong nước hiện nay mới chỉ tập trung vào việc bảo mật trên đường truyền mà ít quan tâm đến vấn đề bảo mật ngay trên CSDL của hệ quản trị CSDL. Hoặc ngay cả những vấn đề đơn giải như sao chép, export dữ liệu hoặc quyền truy cập người dùng tưởng như vô hại thì đó lại chính là những lỗ hổng đầy huy hiểm. Bài viết này tập trung vào thực trạng an ninh dữ liệu của doanh nghiệp và đề xuất một số nguyên tắc, biện pháp khắc phục.

Đề tài 5: Đề xuất giải pháp cho hệ thống kiểm tra, giám sát môi trường trong két nước dằn tàu biển.

Nước dằn có vai trò đặc biệt quan trọng trong việc đảm bảo an toàn khai thác tàu biển. Trong một môi trường thiếu ô xi, song tiềm ẩn các khí độc, khí dễ cháy nổ,..Tuy nhiên, việc kiểm tra và giám sát một cách thủ công, tiềm ẩn nhiều rủi ro cho con người. Trong bài báo này, nhóm tác giả đề xuất một giải pháp cho hệ thống kiểm tra, giám sát môi trường trong két nước dằn tàu biển. Từ đó có thể triển khai, xậy dựng một hệ thống thực phụsc vụ cho công tác kiểm tra, giám sát cũng như sửa chữa và bảo trì két nước dằn trên các tàu biển hiện nay

Đề tài 6. Phát hiện người lạ bằng ảnh mặt

Nhằm mục đích phân biệt người nhà và người lạ/ khách lạ tự động qua thời gian thực, nếu có người lạ đến nhà thì hệ thống sẽ phát ra cảnh báo để hỗ trợ cho gia đình hoặc công ty đơn vị khi cần thiết. Bằng việc ứng dụng kỹ thuật máy học và xử lý ảnh, bài báo này đã nghiên cứu xây dựng chương trình phát hiện người lạ/ khách lạ. Trong đó, mô hình đào tạo phát hiện người lạ dựa trên mạng neural tích chập (CNN). Chương trình triển khai trên ngôn ngữ Python và sử dụng một số thư viện mã nguồn mở như OpenCV, Keras, Dlib, Face-recognition… Mô hình được đào tạo có thể phát hiện người lạ cho một nhóm người

Đề tài 7. Đề xuất mô hình thu thập các thông tin về các lỗ hổng an ninh mạng trên Twitter

Ngăn chặn kịp thời các tổ chức khỏi nhu cầu khai thác thông tin trên mạng qua các lỗ hổng và các cuộc tấn công trên mạng là việc làm cần thiết và cấp bách. Thông tin về mối đe dọa có thể được trích xuất từ nhiều nguồn khác nhau bao gồm các nền tảng truyền thông xã hội nơi mà người dùng công bố thông tin về mối đe dọa theo thời gian thực. Việc thu thập các thông tin về mối đe dọa từ các trang web truyền thông là một nhiệm vụ cần nhiều thời gian đối với các nhà phân tích bảo mật, do vậy có thể trì hoãn các phản ứng kịp thời  với các mối đe dọa đang nổi lên. Trong bài này chúng tôi đề xuất một mô hình để có thể tự động thu thập thông tin về các mối đe dọa từ Twitter. Mô hình này tìm hiều các thông tin đe dọa từ các mô tả được công bố trong các kho lưu trữ công khai (CVE - Common Vulnerabilities and Exposures).

Đề tài 8. Quy hoạch động: một số bài toán điển hình

Ngày nay, với sự phổ biến của máy tính, các ngành, lĩnh vực đang ứng dụng rộng rãi công nghệ thông tin, kéo theo nhu cầu rất lớn về nhiều loại phần mềm ứng dụng. Để phát triển phần mềm đáp ứng các nhu cầu khác nhau với chi phí tiết kiệm nhất và chất lượng tốt nhất, người lập trình phải thiết kế các thuật toán hiệu quả. Một thuật toán vượt trội không chỉ có thể hoàn thiện một thứ mà còn tối đa hóa lợi ích và tạo ra chi phí nhỏ nhất. Là một trong những thuật toán phổ biến, thuật toán quy hoạch động chiếm một vị trí khá quan trọng tin học. Phương pháp này được áp dụng để giải một loạt các bài toán trong thực tế như tổ chức hoạt động và sản xuất, kế hoạch hóa kinh tế, lập lịch, v.v. Phương pháp quy hoạch động đặc biệt thích hợp trong việc giải quyết các bài toán tối ưu.

Đề tài 9. Khai phá nguồn tri thức từ dữ liệu đồ thị.

Dữ liệu đồ thị là các tri thức được biểu diễn dạng đồ thị nhằm mô tả các thực thể thế giới thực và các mối quan hệ giữa chúng. Nhờ sự phát triển của Semantic Web, đồ thị tri thức thường được kết hợp với cá dự án dữ liệu mở nhằm tập trung vào các kết nối giữa khái niệm và thực thể. Hiện tại, có rất nhiều kho dữ liệu mở lớn với cộng đồng đông đảo cùng nhau tạo ra dữ liệu như Dbpedia, Wikipedia,…Do đó, việc khai phá, truy hồi thông tin từ những nguồn dữ liệu lớn này vừa là cơ hội vừa là thách thức của những người phân tích dữ liệu.

Đề tài 10. Phương pháp phát triển phần mềm ứng dụng công nghệ DevOps, khả năng và ứng dụng

Sự phát triển của các phương pháp xây dựng và phát triển phần mềm ngày nay đã có những phát triển vượt trội so với thế kỷ trước. Bằng cách áp dụng các công cụ và biện pháp kỹ thuật có sự hộ trợ của các hệ thống thông minh khiến cho tốc độ triển khai, hiệu quả, khả năng mở rộng của phần mềm ngày một nhanh và mạnh hơn. Trong dòng lịch sử của các phương pháp phát triển phần mềm, các công ty và đơn vị phát triển phần mềm đã trải qua 3 mốc đặc biệt có thể kể đến: 1) Phương pháp phát triển phần mềm “thác nước – waterfall” – tập trung rút ngắn thời gian phát hành sản phầm. 2)  Phương pháp phát triển “linh hoạt – agile” – tập trung vào việc tối ưu hóa vòng đời phát triển phần mềm. 3) và ngày nay là DevOps – Hướng đến mục tiêu hợp nhất hoạt động phát triển và vận hành các hệ thống phần mềm như 1 nhóm thống nhất. Phương pháp DevOps với ưu điểm cải thiện hiệu quả sản xuất (phát triển) phần mềm, tăng cường sự phối hợp cũng như quá trình bàn giao sản phẩm đến tay khách hàng mà gần như không có độ trễ. Điều này thực sự có ý nghĩa trong kỷ nguyên hiện nay, thời điểm mà các hệ thống thông tin chỉ cần trục trặc một vài phút có thể khiến đơn vị quản lý tổn thất rất nhiều về kinh tế cũng như thương hiệu. Nhằm đáp ứng đòi hỏi của thực tế, nhóm tác giả thông qua bài viết này để nghiên cứu và làm rõ các thông tin về DevOps khả năng và ứng dụng của DevOps. Thông qua đó có thể tiến tới cập nhật, bổ sung chương trình dạy và học cho sinh viên ngành Công nghệ thông tin tại trường Đại học Hàng Hải Việt Nam.

Hội thảo đã thành công tốt đẹp và bế mạc vào 17h cùng ngày.