核心内容摘要
驭梦而行:那些年,我们一起追逐的“小马拉大车”经典
人工智能学习-AI入试相关题目练习-第十四次1-前言3-问题题目训练【模擬問題①】既出近似探索アルゴリズム問題1【模擬問題②】既出近似Q学習・方策問題2【予測問題①】新傾向確率的推論・状態推定問題3【予測問題②】新傾向汎化性能・評価手法問題44-练习日语版本解析【模擬問題①】問題1最良優先探索【模擬問題②】問題2Q学習・方策【予測問題①】問題3確率的推論・状態推定【予測問題②】問題4汎化性能・評価速查考前 30 秒5-练习日语版本【最良優先探索】【方策Q学習】グリーディ法ε-グリーディ法ボルツマン選択【粒子フィルタ】【ベイズフィルタ】✅ 全空欄まとめ速查版6-
总结1-前言为了应对大学院考试我们来学习相关人工智能相关知识并做各种练习。
通过学习也算是做笔记让自己更理解些。
3-问题题目训练【模擬問題①】既出近似探索アルゴリズム問題1探索問題において評価値に基づいて探索順序を決定する手法を最良優先探索という。
この手法では探索候補を保持する (a) とすでに展開済みのノードを保持する (b) を用いる。
初期状態は (a) に追加され(b) は © に初期化される。
探索の各反復では(a) から評価値が最も (d) ノードを取り出し(b) に追加する。
また展開によって得られた未探索ノードは (a) に追加され( a ) 内のノードは評価値 (e) に基づいて並び替えられる。
ここで用いられる評価値は一般に実コスト (f) とヒューリスティック関数 (g) を用いて定義される。
(a)(g) に入る最も適切な語句を記せ。
【模擬問題②】既出近似Q学習・方策問題2Q学習では状態 s における行動 a の価値を表す関数を (a) と呼ぶ。
この値は報酬と (b) の情報を用いて逐次的に更新される。
行動選択のための方策として常に最も Q 値が © 行動を選択する方法を(d) 法という。
一方探索と活用のバランスをとるため確率 (e) でランダムに行動を選択し確率 (f) で(d) 法に基づく行動選択を行う方法が用いられる。
(a)(f) に入る語句を記せ。
【予測問題①】新傾向確率的推論・状態推定問題3実環境で動作する知能システムでは観測情報に (a) が含まれるため現在の状態を正確に把握できない場合がある。
このような状況では状態を単一の値ではなく (b) として表現し観測が得られるたびにその分布を更新する手法が用いられる。
この更新処理は© ステップと (d) ステップから構成され前者では状態遷移モデルに基づいて分布を推定する。
後者では観測モデルを用いて (e) を計算し分布の総和が 1 となるように (f) を行う。
(a)(f) に入る最も適切な語句を記せ。
【予測問題②】新傾向汎化性能・評価手法問題4機械学習モデルは学習データに対して高い性能を示しても未知データに対して同様の性能を示すとは限らない。
このような現象はモデルが学習データに過度に適合することによって生じ一般に (a) と呼ばれる。
(a) が生じるとモデルの (b) が低下するため学習時にはモデルの複雑さを制御する © が導入される。
またモデルの性能を評価するためデータを分割して学習と評価を繰り返す方法として (d) が用いられる。
さらに学習途中で性能悪化を検知して学習を停止する手法を (e) という。
(a)(e) に入る語句を記せ。
4-练习日语版本解析【模擬問題①】問題1最良優先探索(a)オープンリスト开放表/候选列表(b)クローズドリスト关闭表/已展开列表©空空/空集合(d)小さい最小的(e)f(s)评价函数值(f)g(s)实际代价(g)h(s)启发式函数【模擬問題②】問題2Q学習・方策(a)Q値行動価値関数Q 值/动作价值函数(b)次状態下一状态©最大最大的(d)グリーディ贪婪(e)εε(f)1−ε1−ε【予測問題①】問題3確率的推論・状態推定(a)ノイズ噪声(b)確率分布概率分布©予測预测步骤(d)観測更新观测更新/修正步骤(e)尤度似然(f)正規化归一化/规范化【予測問題②】問題4汎化性能・評価(a)過学習オーバーフィッティング过拟合(b)汎化性能泛化性能©正則化正则化(d)交差検証交叉验证(e)早期終了Early Stopping早停/提前停止速查考前 30 秒Open / Close / 空 / 小さい / f(s)g(s)h(s) Q値 / 次状態 / 最大 / グリーディ / ε / 1−ε ノイズ / 確率分布 / 予測 / 観測更新 / 尤度 / 正規化 過学習 / 汎化性能 / 正則化 / 交差検証 / 早期終了5-练习日语版本【最良優先探索】最良優先探索のアルゴリズム(a)オープンリスト(b)クローズドリスト©オープンリスト【方策Q学習】グリーディ法(d)最大ε-グリーディ法(f)ε(g)1−εボルツマン選択(h)ボルツマン【粒子フィルタ】(i)近似(j)確率【ベイズフィルタ】ベイズフィルタのアルゴリズム(i)a_t−1(j)正規化✅ 全空欄まとめ速查版(a) オープンリスト (b) クローズドリスト (c) オープンリスト (d) 最大 (f) ε (g) 1−ε (h) ボルツマン (i) 近似 (j) 確率 (i) a_t−1 (j) 正規化6-