otus-rlcourse
Basic Info
File List (84 Files)
01 ΠΠ½Π°ΠΊΠΎΠΌΡΡΠ²ΠΎ Ρ Reinforcement Learning/01 ΠΠ½Π°ΠΊΠΎΠΌΡΡΠ²ΠΎ Ρ Reinforcement Learning.mp4
01 ΠΠ½Π°ΠΊΠΎΠΌΡΡΠ²ΠΎ Ρ Reinforcement Learning/01 ΠΠ½Π°ΠΊΠΎΠΌΡΡΠ²ΠΎ Ρ Reinforcement Learning.pdf
02 ΠΠ»ΡΡΠ΅Π²ΡΠ΅ ΠΏΠΎΠ½ΡΡΠΈΡ RL. Π°Π³Π΅Π½Ρ, ΡΡΠ΅Π΄Π°, Π½Π°Π³ΡΠ°Π΄Π°, ΠΏΠΎΠ»ΠΈΡΠΈΠΊΠ°. ΠΠΎΡΡΡΠΎΠ΅Π½ΠΈΠ΅ ΡΡΠ΅Π΄Ρ/02 ΠΠ»ΡΡΠ΅Π²ΡΠ΅ ΠΏΠΎΠ½ΡΡΠΈΡ RL. Π°Π³Π΅Π½Ρ, ΡΡΠ΅Π΄Π°, Π½Π°Π³ΡΠ°Π΄Π°, ΠΏΠΎΠ»ΠΈΡΠΈΠΊΠ°. ΠΠΎΡΡΡΠΎΠ΅Π½ΠΈΠ΅ ΡΡΠ΅Π΄Ρ.mp4
02 ΠΠ»ΡΡΠ΅Π²ΡΠ΅ ΠΏΠΎΠ½ΡΡΠΈΡ RL. Π°Π³Π΅Π½Ρ, ΡΡΠ΅Π΄Π°, Π½Π°Π³ΡΠ°Π΄Π°, ΠΏΠΎΠ»ΠΈΡΠΈΠΊΠ°. ΠΠΎΡΡΡΠΎΠ΅Π½ΠΈΠ΅ ΡΡΠ΅Π΄Ρ/02 ΠΠ»ΡΡΠ΅Π²ΡΠ΅ ΠΏΠΎΠ½ΡΡΠΈΡ RL. Π°Π³Π΅Π½Ρ, ΡΡΠ΅Π΄Π°, Π½Π°Π³ΡΠ°Π΄Π°, ΠΏΠΎΠ»ΠΈΡΠΈΠΊΠ°. ΠΠΎΡΡΡΠΎΠ΅Π½ΠΈΠ΅ ΡΡΠ΅Π΄Ρ.pdf
02 ΠΠ»ΡΡΠ΅Π²ΡΠ΅ ΠΏΠΎΠ½ΡΡΠΈΡ RL. Π°Π³Π΅Π½Ρ, ΡΡΠ΅Π΄Π°, Π½Π°Π³ΡΠ°Π΄Π°, ΠΏΠΎΠ»ΠΈΡΠΈΠΊΠ°. ΠΠΎΡΡΡΠΎΠ΅Π½ΠΈΠ΅ ΡΡΠ΅Π΄Ρ/2025_11_05_practice.ipynb
03 ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ RL. Value based/03 ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ RL. Value based.mp4
03 ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ RL. Value based/03 ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ RL. Value based.pdf
04 ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ RL. Policy based/04 ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ RL. Policy based.mp4
04 ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ RL. Policy based/04.0 ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ RL. Policy based.pdf
04 ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ RL. Policy based/04.1 ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ RL. Policy based. ΠΠΎΠΌΠ°ΡΠ½Π΅Π΅_Π·Π°Π΄Π°Π½ΠΈΠ΅.pdf