模型規模、引入自注意力機制、採用
transformer
架構、擴大訓練語料庫以及利用多工學習和遷
移學習等方法。這些改變使得大語言模型能夠更好地捕捉文字中的語義和語法資訊,處理長文字任
務,提高訓練效率,拓展泛化能力,並在自然語言處理領域取得了顯著的進步和成就。
電力行業是社會經濟發展的基礎能源,具有基礎性、公共性、穩定性等特點。在電力行業的研
究中,需要關注電力轉型、可持續發展、智慧電網、新能源整合、電力市場和能源交易、電力系統
安全與穩定性等多領域課題。這些課題的研究對全球能源結構轉型和節能減排戰略的實施具有重要
意義,使得電力供應更加智慧化、高效化、穩定化,能更好地滿足社會的用電需求與經濟的發展要
求。
電力行業的文獻具有技術性、實踐性、政策性、跨學科性和資料性等多個特點。文獻中包含了
大量專業的技術術語和技術細節,並且與實際工程技術緊密相關。同時,政策法規、政策導向等方
面的內容也是文獻中常見的一部分。由於電力行業的複雜性和多學科交叉性,電力行業的研究需要
廣泛涉及多個學科知識並結合大量的資料進行分析和建模。這些文獻的研究成果對於電力行業的發
展和實踐具有重要的指導意義,有助於推動電力行業的高效安全穩定發展。
lca(life
cycle
assessment),即生命週期評價。生命週期評價是一種系統性的方法,用於
評估產品、服務或活動的整個生命週期中與環境和資源相關的影響,框架如圖
1.1
所示。生命週期
評價已經成為評估和比較不同產品或活動環境績效的重要工具,也是推動可持續生產和消費的重要
手段之一。
第
1~2
周:調研。查閱畢業設計相關資料,與指導老師討論並確定題目及任務。
第
3~4
周:撰寫開題報告。按照任務書要求,查閱資料(包括與畢設相關英文資料的查閱與翻
譯),確定大致框架,撰寫開題報告,進行開題答辯。
第
5~7
周:資料爬取,分析及挖掘。對電力
lca
英文文獻資料進行拆解,撰寫相應部分的論
文,準備中期檢查。
第
8
周:中期檢查,構建向量知識庫。
第
9~10
周:基於通用大模型搭建特定領域專業大模型。對模型效能進行測試,針對測試結果進
行最佳化。
第
11~13
周:撰寫論文。完善結果,撰寫論文。
第
14
周:提交論文資料。
第
15~16
周:答辯
1.主要內容
以有關電力行業的生命週期評價
lca(life
cycle
assessment)英文文獻為研究對
象,對這些論文進行解析,構建大模型能直接呼叫的向量資料庫,測試向量知識庫
對大語言模型在特定領域的論文解析的專業能力。
2.目標
編寫基於
unstructured
庫的文獻處理程式,搭建基於通用大模型的特定領域專業大
模型,基於
chatbot
模式測試向量知識庫對大語言模型在該領域的論文解析的專業
能力,並基於測試結果,對向量知識庫進行最佳化。