言語指示に対するPV-RNNの視覚予測

言語指示に対する視覚出力を予測するPV-RNNモデルの異なるモジュールの視覚表現。最初の映像では、「put green on blue(青の上に緑を載せて)」に対する正確な予測が示されているが、次の映像では、「put blue on yellow(黄色の上に青を載せて)」に対して誤った予測が示されている。

日付:
2024年12月19日
作者:
adrian-skov
出典:
ヴィジャヤラガヴァン他 (2025)
シェア: