核心内容摘要
EasyAnimateV5-7b-zh-InP效果展示:LOGO矢量图→科技感粒子流动视频特效
人工智能学习-AI入试相关题目练习-第十三次1-前言3-问题题目训练【模擬問題①】既出近似強化学習・価値関数問題1【模擬問題②】既出近似教師あり学習・最適化問題2【予測問題①】新傾向確率的推論・状態推定問題3【予測問題②】新傾向学習の限界・評価問題44-练习日语版本解析【模擬問題①】問題1強化学習・価値関数【模擬問題②】問題2教師あり学習・最適化【予測問題①】問題3確率的推論・状態推定【予測問題②】問題4学習の限界・評価5-単語练习日语版本6-
总结1-前言为了应对大学院考试我们来学习相关人工智能相关知识并做各种练习。
通过学习也算是做笔记让自己更理解些。
3-问题题目训练【模擬問題①】既出近似強化学習・価値関数問題1強化学習ではエージェントが環境との相互作用を通じて学習を行う。
このとき環境は状態 (a)行動 (b)および報酬 © によって記述される。
状態遷移が現在の状態と行動のみに依存する性質を (d) といいこの仮定に基づいて強化学習の問題は (e) として定式化される。
価値反復法では状態価値関数は (f) によって再帰的に定義されこの関係式を (g) 方程式と呼ぶ。
(a)(g) に入る最も適切な語句を記せ。
【模擬問題②】既出近似教師あり学習・最適化問題2教師あり学習では入力データとそれに対応する (a) の組を用いて学習を行う。
学習の目的はモデルの出力と正解との差を表す (b) を最小化することである。
この最適化では誤差関数の © を計算し更新量を制御する (d) を用いてパラメータを修正する。
しかし誤差関数が非凸である場合学習は (e) に収束する可能性がある。
この問題を抑制するため(f) を導入する手法が広く用いられている。
(a)(f) に入る語句を記せ。
【予測問題①】新傾向確率的推論・状態推定問題3実世界の知能システムでは観測情報に (a) が含まれるため現在の状態を一意に決定できない場合が多い。
このような場合状態を単一の値ではなく (b) として表現し観測が得られるたびにその分布を更新する手法が用いられる。
この手法ではまず © に基づいて状態分布を予測し次に観測モデルを用いて (d) を計算する。
最後に分布の総和が 1 となるように (e) を行い更新後の分布を (f) と呼ぶ。
(a)(f) に入る最も適切な語句を記せ。
【予測問題②】新傾向学習の限界・評価問題4機械学習モデルは学習データに対して高い性能を示しても未知データに対して同様の性能を示すとは限らない。
このような現象はモデルが学習データに過度に適合することによって生じ一般に (a) と呼ばれる。
(a) が発生するとモデルの (b) が低下する。
これを防ぐため学習時にモデルの複雑さを抑制する © が導入される。
またデータを複数に分割して性能を評価する方法として (d) があり学習途中で性能悪化を検知して学習を停止する手法を (e) という。
(a)(e) に入る語句を記せ。
4-练习日语版本解析【模擬問題①】問題1強化学習・価値関数(a)状態状态(b)行動动作©報酬奖励(d)マルコフ性马尔可夫性(e)マルコフ決定過程MDP马尔可夫决策过程(f)ベルマン方程式贝尔曼方程式(g)ベルマン贝尔曼【模擬問題②】問題2教師あり学習・最適化(a)正解ラベル正确标签(b)損失関数誤差関数损失/误差函数©勾配梯度(d)学習率学习率(e)局所最小値局部最小值(f)正則化正则化【予測問題①】問題3確率的推論・状態推定(a)ノイズ噪声(b)確率分布概率分布©状態遷移モデル状态转移模型(d)尤度似然(e)正規化归一化(f)事後分布事後確率分布后验分布【予測問題②】問題4学習の限界・評価(a)過学習オーバーフィッティング过拟合(b)汎化性能泛化性能©正則化正则化(d)交差検証交叉验证(e)早期終了Early Stopping提前停止5-単語练习日语版本6-