【114-1微學分課程】深度學習基礎理論與法律資料分析 Foundations of Deep Learning and Legal Data Analytics

人工智慧微學程

課程概述與目標

本課程旨在提供深度學習領域之實作導向與循序漸進的入門訓練。學生將自建立一個基礎的手寫數字分類器開始,逐步拓展至訓練更為複雜之模型,應用範疇涵蓋美國手語識別、動物影像分類,自然語言處理任務(例如新聞標題生成)等。

法律資料分析,即策略性蒐集並分析大量法律資料,以辨識趨勢、提煉見解,以支持科學理性判決。本課程聚焦法律資料分析之應用層面,運用深度學習技術來分析歐洲人權法院的實際判決,並透過深度學習之視角銜接法學理論與實務。

課程之最終階段,學生將運用遞迴神經網絡與長短期記憶網絡對法律文本進行語意分析,並評估其在該應用場景中之相對效能。課程重點強調實務導向之建模流程,包括新興模型架構與技術於效能優化之應用、預訓練模型之導入,以及遷移學習策略之實作。藉由操作多元資料集與模型架構,學生將建立發展與部署深度學習專案所需之核心能力。

授課教師

資訊工程學系 謝秉均 副教授
資科工所 洪鈺恆博士生、科技法律研究所 張雅菲博士生

對應總課程名稱

人工智慧應用與實作
Artificial Intelligence Applications and Implementations

課程日期

8/25, 8/26, 8/27, 8/28
10:10-12:00, 13:20-15:10

課程總時數

16小時

上課地點

綜合一館 301

修課人數

16人

先修科目或先備能力

自備物品

筆記型電腦

課程教材

課程參考書:
Goodfellow, Ian, Yoshua Bengio, and Aaron Courville. Deep Learning. Cambridge, Massachusetts: the MIT Press, 2016.
Grimmer, Justin, Margaret E. Roberts, and Brandon M. Stewart. Text As Data: A New Framework for Machine Learning and the Social Sciences. Princeton, NJ: Princeton University Press, 2022.Ashley, Kevin D., Artificial Intelligence and Legal Analytics: New Tools for Law Practice in the Digital Age. New York, NY: Cambridge University Press, 2017.

參考資料之期刊論文:
Guido Governatori et al., Thirty Years of Artificial Intelligence and Law: the First Decade, in Artificial intelligence and law, 2022-12, Vol.30 (4), p.481-519.
Giovanni Sartor et al., Thirty Years of Artificial Intelligence and Law: the Second Decade, Artificial intelligence and law, 2022-12, Vol.30 (4), p.521-557.
Serena Villata et al., Thirty Years of Artificial Intelligence and Law: the Third Decade, Artificial intelligence and law, 2022-12, Vol.30 (4), p.561-591.
Chalkidis, Ilias, Manos Fergadiotis, Prodromos Malakasiotis, Nikolaos Aletras, and Ion Androutsopoulos. “LEGAL-BERT: The Muppets Straight out of Law School.” Findings of the Association for Computational Linguistics: EMNLP, 2020.
Chalkidis, Ilias, Ion Androutsopoulos. “Neural Legal Judgment Prediction in English.” Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, 2019.

作業、考試、評量

出席率30%、課堂討論30%、期末成果40%。

課程大綱

單元主題 內容綱要 講授 示範 習作 其他
從深度學習基礎探索法律資料分析 本課程自深度學習之基礎出發,涵蓋其發展歷程、核心概念,以及以手寫數字等實際資料訓練簡單神經網路。學習者將逐步應用這些技術於法學領域,作為判決分析與法律推理之基礎,為法律資料分析奠定技術根基。 2hr 2hr
CNNs 和模型部署於歐洲人權法院實務判決分析 進階學習卷積神經網路(CNN)構建、資料增強技術應用與模型部署,重點在優化模型效能與提升在複雜法律資料集,特別是歐洲人權法院實務判決分析之穩健性。學習者將培養由法學理論概念轉化為法律資料分析領域之可延伸擴充解決方案。 2hr 2hr
探索預訓模型與進階架構於法律資料分析 了解如何運用預訓練模型進行遷移學習,並探討自然語言處理、循環神經網路及生成對抗網路等進階主題。經由此過程對上述方法於複雜法律文本中之應用與限制進行理解,並透過法學資料分析之實作,得以銜接計算方法與法學應用。 2hr 2hr
期末成果展示與反饋 期末成果展示與反饋 4hr

課程進度表

日期 課程進度、內容、主題
8/25 單元A. Part 1 深度學習導論
● 理解深度學習與傳統程式設計範式的根本差異
● 探討深度學習於視覺、語言與機器人等領域的實際應用
● 學習資料與運算力的進展如何推動深度學習發展
● 深度學習開發流程之概觀
法律資料分析導論
● 法律資料分析的基礎技術與理論演進
● 過去三十年人工智慧與法學研究之文獻回顧(一)
8/25 單元A. Part 2 神經網路訓練實作
實作 A:MNIST 手寫數字分類
● 介紹 MNIST 資料集及其結構
● 使用 Keras API 載入並預處理資料
● 設計並訓練基礎神經網路模型
● 觀察訓練結果並辨識效能趨勢
● 反思深度學習如何解決傳統規則式程式設計無法處理的問題
實作 B:美國手語(ASL)影像分類
● 準備與預處理手語影像資料集
● 建構簡單的影像分類模型
● 以 ASL 字母影像進行模型訓練與評估
深度學習於法學領域之應用
● 深度學習於法學領域之基礎技術與理論發展
● 過去三十年人工智慧與法學研究之文獻回顧(二)
8/26 單元B. Part 1 卷積神經網路(CNN)
● 理解卷積濾波器與特徵圖的直觀概念
● 掌握池化(Pooling)、隨機失活(Dropout)等模型層級設計
● 設計並訓練 CNN 處理影像資料
● 分析 CNN 在圖像任務中的優勢
實作:
● 結構化輸入資料以適用於卷積模型
● 開發並訓練多層卷積神經網路
● 評估模型之準確性與泛化能力
歐洲人權法院實際判決之法律資料分析
● 法學背景:歐洲人權法院之歷史沿革、基本原則與影響力
● 歐洲人權法院法律資料分析之現有文獻與實務應用回顧(一)
8/26 單元B. Part 2 資料增強與模型部署
● 探討資料增強技術(如翻轉、旋轉、亮度調整等)
● 應用資料增強以提升模型的穩健性與泛化能力
● 學習模型儲存與重複使用的基本方法
實作:
● 對 ASL 資料集進行資料增強處理
● 使用擴增後的資料重新訓練模型
● 儲存訓練完成之模型以供後續部署應用
歐洲人權法院實際判決之法律資料分析
● 法律資料分析:聚焦於 ECHR 資料集
● 歐洲人權法院法律資料分析之現有文獻與實務應用回顧(二)
8/27 單元C. Part 1 預訓模型與遷移學習
● 理解遷移學習的概念與實務優勢
● 探索模型資源庫(如 TensorFlow Hub、PyTorch Hub)
● 調整預訓模型以應用於特定任務
實作:
● 載入並評估預練模型效能
● 重新格式化與預處理外部資料集以確保相容性
● 使用預訓模型對全新資料進行推論
橋接深度學習方法與法律資料分析
● 將深度學習方法融入法律資料分析
● 法學領域之自適應:遷移學習與自然語言處理技術之應用
8/27 單元C. Part 2 進階模型架構:RNN 與 LSTM
● 序列資料建模導論
● 比較 RNN 與 LSTM 在處理長期依賴關係中的表現差異
● 將此類模型應用於自然語言處理任務
實作:
● 使用 RNN 生成自然語言標題
● 比較 RNN 與 LSTM 在法律文件分類或預測任務中的效能表現
橋接深度學習方法與法律資料分析
● 評估 RNN 與 LSTM 模型於法律文件分類任務中的表現
● 思索更多新穎方法應用於實際司法判決之法律資料分析
8/28 期末成果展示與反饋

常見問題