資工專題競賽 學生大放異彩
資訊工程專題是本校資工系重要的必修課程之一,同學們自由報名參加專題競賽,經由同儕間互相觀摩與切磋,展現資工系多元豐富研究成果,同時也強化了資工系同學們的凝聚力。以下是得獎作品介紹:
特 優
專題題目:Designing Area-Efficient Ray-Triangle Intersection Hardware Unit in GPU RT-Core
學生姓名:甯宇綸
指導教授:葉宗泰教授
專題介紹:
這個專案專注於GPU RT核心中的資源消耗型光線-三角形交集單元。我們將Moller-Trumbore交集演算法拆解為三個階段。通過篩選式硬體設計,每個階段都排除可能不相交的三角形,以降低後續階段對硬體的需求,從而減少整體面積。我們的方法在FPGA合成中實現了面積上的優勢,且性能損失在可接受範圍內。我們還設計了符合AXI4協定的交集單元,並將其部分整合進系統,包括Xilinx的AXI4快取,並使用Genesis ZU FPGA平台進行驗證。
優 等
專題題目:Research on Predictive Networks Based on Multivariate Short Time Series Inputs and Transformer Architecture
學生姓名:賴怡暄、吳宜靜、楊芊華
指導教授:黃敬群教授
專題介紹:
隨著時間序列預測技術的進步,基於Transformer的模型在處理長時間序列預測任務中展現了令人印象深刻的性能。然而,這些模型在短期序列預測中的表現仍有待提升。這主要是因為模型架構在有效捕捉短序列特徵方面存在一定限制,從而影響了預測的準確性。為了提高基於Transformer的模型在短期序列預測中的表現,我們對最先進的Crossformer模型進行了以下優化: 首先,我們引入了ProbSparse Self-attention,這一改進精煉了原有的Crossformer路由器機制。通過在計算Attention Scores之前對Query矩陣進行初步篩選,我們保留了重要的Query值,使模型能夠基於顯著特徵做出更準確的預測。 其次,我們引入了混合專家模型(MoE),以處理輸入數據的多樣化分布和時間序列的不同特徵。MoE利用不同的前饋網路(FFNs)專家來處理序列中的不同特徵,並適應多變量數據,使信息能夠由多個FFNs同時處理,從而提升模型的適應性。 這些改進使得模型能夠更有效地處理短期序列中的局部特徵,從而提高了在小型數據集(ILI)和大型數據集(ETTh1)上的預測準確性。
優 等
專題題目:Learning Diffusion Models with Occlusion Handling for Facial Landmark Detection
英文姓名:曾家祐、侯博軒
指導教授:林彥宇教授
專題介紹:
人臉特徵點偵測(Facial Landmark Detection, FLD)的目的是檢測人臉影像上的特定關鍵點。準確的人臉關鍵點檢測對於許多應用至關重要,包括人臉識別、表情分析和虛擬實境等。在我們的研究中,通過將處理期望的面部關鍵點的擴散模型(diffusion models)進行條件化。我們充分利用擴散模型在處理噪聲樣本方面的優勢,從而恢復正確的關鍵點,同時訓練我們的模型能夠識別從錯誤關鍵點到正確人臉關鍵點位置的反向過程。擴散模型在恢復噪聲樣本方面表現出色。因此,我們提議探索其在處理當前FLD方法中因人臉影像遮蔽引起的檢測誤差的可能性。我們的模型具有改進錯誤人臉關鍵點的能力,最終可以作為所有FLD方法的精煉器。
佳 作
專題題目:Video Change Detection via Transformer-Based Architecture
學生姓名:文玠敦、馬楷翔、莊書杰
指導教授:陳冠文教授
專題介紹:
我們的專案探討了使用基於Transformer的模型TransCD來檢測影片中的變化。與傳統方法需要在時間和空間維度上都進行對齊不同,我們的方法僅對齊時間維度,從而在光線不足和視角極端變化等高難度條件下提升了性能。我們實施了自適應幀搜尋技術,以動態對齊幀,並使用微調技術來調整模型權重以提高準確性。我們的結果顯示,這種方法不僅提高了效率,同時保持了高品質的檢測效果,展示了Transformer架構在推進影片分析技術的潛力。
佳 作
專題題目:Designing Fixed-Point Transcendental ISAs for Heterogeneous TinyML Acceleration
學生姓名:蔡承翰、范均宏
指導教授:葉宗泰教授
專題介紹:
這個專案設計了定點數先驗指令集架構(ISA),旨在提升RISC-V CPU上的TinyML性能,主要聚焦於MobileViT模型。通過將複雜操作分解為基本組件,並實作專門的ISA和設計對應的硬體單元,我們實現了顯著的加速。我們使用CFU-Playground平台在NEXYS A7-100T FPGA板上進行測試,發現在TensorFlow Lite for Microcontrollers(TFLM)核心中,我們的自定義指令使得MobileViT模型推理速度比基準CPU快了1.56倍。相比於傳統的查找表(LUT)方法,我們的方法提供了更大的靈活性和記憶體效率,支持多種激活函數而無需硬體修改。
佳 作
專題題目:Video Deblurring and Interpolation with Motion-Aware Transformer
學生姓名:朱致伶
指導教授:林彥宇教授
專題介紹:
我們提出了一個創新的運動感知的 Transformer 模型,用於同時進行視頻去模糊和插幀的雙重任務。該模型通過從多個模糊圖像中恢復高幀率且清晰的視頻,有效解決了運動模糊問題。運動模糊是由於曝光過程中物體的持續運動所造成的。為了解決這個問題,我們的運動感知 Transformer 模型充分利用了時間資訊,通過在視頻中多個連續模糊幀間共享 Intra-Motion 和 Inter-Motion 提示來實現。這些運動提示記錄了像素運動的大小和方向。Intra-Motion 提示捕捉單個模糊幀內的像素運動,而 Inter-Motion 提示則捕捉相鄰模糊幀間的像素運動。我們使用類似 UNet 的運動元素提取器 (motion extractor) 來預測這些運動提示,並將其輸入到視頻去模糊和插幀的 Transformer 中,從而降低了這些任務的複雜性並提升了模型性能。我們的研究表明,所提出的運動元素提取器顯著提升了視頻去模糊和插幀任務的效果。我們將持續改進運動提示在視頻去模糊和插幀 Transformer 模型中的整合與應用。
佳 作
專題題目:BEVGaussian: Generate Scene-level 3D Gaussian from BEV image
學生姓名:李杰穎
指導教授:劉育綸教授
專題介紹:
在本研究中,我們的目標是從鳥瞰圖(BEV)圖像中生成場景級的3D高斯分佈,包括衛星圖像、
高度圖和語義圖。現有的方法僅限於物件等級的生成,無法產生場景級的三維高斯分佈。為了解決這個問題,我們利用現有的物件生成技術,從 BEV 圖像中創建高品質的3D高斯分佈,然後將這些物件整合到場景中。我們的方法不需要訓練,並且通過使用 BEV 圖像作為輸入,可以輕鬆地修改三維場景。