文字挖掘與分析名詞解釋10道題,英文縮寫,例如rnn,lda,mlp,fnn模型和演算法的理解(word2vec等模型原理),損失函式,語言模型的概念,程式碼類:根據公式\/輸出寫原始碼交叉熵損失設定引數解決資料不平衡1自然語言處理自然語言處理研究實現人與計算機之間用自然語言進行有效通訊的各種理論和方法。自然語言處理技
術發展經歷了基於規則的方法、基於統計學習的方法和基於深度學習的方法三個階段。自然語言處理
由淺入深的四個層面分別是形式、語義、推理和語用,當前正處於由語義向推理的發展階段。2文字分類文字分類是機器對文字按照一定的分類體系自動標註類別的過程,
也是自然語言處理最早的應用領域之一。你能想到哪些自動文字分類
應用?
垃圾郵件分類,新聞型別分類,...情感分析情感分析也可以認為是文字分類的一個子型別。情感分析往往應
用於電商的使用者評價分析,微博等自媒體的使用者留言傾向分析,或者
公共事件的輿情分析。3資訊抽取資訊抽取是採用機器學習演算法從非結構化文字中自動抽取出使用者感興趣的內容,並進
行
結構化處理。例如命名實體識別、實體關係抽取、事件抽取、因果關係抽取文字生成包括自動文章撰寫、自動摘要生成等內容4資訊檢索資訊檢索指資訊按一定的方式組織起來,並根據使用者的需要找出有關的資訊的過程和技術。搜
索引擎是當前主流的資訊檢索方式,從最初的關鍵詞匹配演算法到如今的語義檢索技術,
使用者已經能夠隨心所欲的檢索自
己所需的資訊。
中心度:在圖論和網路分析中,中心度用來衡量節點在圖中的重要
性,中心度並不是節點本身帶有的屬性,而是一種結構屬性,
是在圖或網路結構下節點才具有的屬性。中心度可用來解決不同領域的問題:
例如在社交網路中尋找影響力最大的使用者,在網際網路或城市網路中尋找
關鍵的基礎設施,以及在疾病網路中發現超級傳播者度中心度:指節點與其他節點相連邊的數量,即透過節點的鄰居
數目(區域性資訊)來計算節點度重要程度。
基本思想:
北門的,獎勵500金,但沒有人去嘗試。根據期望理論,這是由於:(c)
a、500金的效價太低
b、居民對完成要求的期望很低
居民對得到報酬的期望很低賓
槍打出頭鳥,大家都不敢嘗試
當一位30~40歲的科研工作者顯示出卓越的技術才能時,作為該科研人員的領導對他的最有效的激勵應該是:(b)
高額獎金
配備最好的研究條件
提職
精神獎勵(如評為勞模)
在社會生活中,人們對各種客觀存在的文化用品的需要,稱為:(d)
a、社會性需要
b、自然性需要
c、精神需要
d、物質需要
在人的各種需要中,最高層次的需要是:(a)
a、自我實現需要
b、安全需要
c、尊重需要
d、社會需要