AI 代理环境

AI 代理环境

环境是包围代理的世界上的所有事物,但它不是代理本身的一部分。环境可以描述为存在代理的情况。
该环境是代理生活,操作并为代理提供感知并对其采取行动的环境。通常认为环境是非女性化的。

环境的特征

根据Russell和Norvig的观点,环境可以具有各种特征代理商的身分:

完全可观察与部分可观察
静态与动态
离散与连续
确定性与随机性
单代理与多代理
偶发与顺序
已知与未知
可访问与不可访问

1、完全可观察与部分可观察:

如果代理传感器可以在每个时间点感知或访问环境的完整状态,则它是完全可观察的环境,否则它是部分可观察的
完全可观察的环境很容易,因为无需维护内部状态即可跟踪世界历史。
在所有环境中都没有传感器的代理,那么这种环境称为不可观察

2、确定性与随机性:

如果代理的当前状态和选定的动作可以完全确定环境的下一个状态,则这种环境称为确定性环境。
随机环境本质上是随机的,不能由主体完全确定。
在确定性,完全可观察的环境中,业务代表无需担心不确定性。

3、情节与顺序:

在情景环境中,有一系列的一次性动作,并且仅需要当前感知即可。
但是,在顺序环境中,座席需要记忆过去的动作以确定下一个最佳动作。

4、单代理与多代理

如果一个环境中仅涉及一个代理程序,并由其自身进行操作,则这种环境称为单代理程序环境。
但是,如果在一个环境中运行多个代理,那么这种环境称为多代理环境。
多代理环境中的代理设计问题不同于单代理环境。

5、静态与动态:

如果环境在代理程序进行讨论时可以改变自身,则该环境称为动态环境,否则称为静态环境。
静态环境易于处理,因为代理在决定采取行动时无需继续观察世界。
但是对于动态环境,座席需要始终关注每个动作的世界。
出租车驾驶是动态环境的一个例子,而填字游戏则是静态环境的一个例子。

6、离散与连续:

如果在一个环境中可以执行有限数量的感知和动作,则这种环境称为离散环境,否则称为连续环境。
象棋游戏是在离散环境下进行的,因为可以执行的动作数量有限。
无人驾驶汽车就是一个连续环境的例子。

7、已知与未知

已知和未知实际上不是环境的特征,但是执行动作是代理的知识状态。
在已知环境中,所有操作的结果对于代理都是已知的。在未知环境中,座席需要了解其工作方式才能执行操作。
一个已知环境很有可能是部分可观察的,而一个未知环境是完全可观察的。

8、可访问与不可访问

如果代理可以获取有关该州环境的完整且准确的信息,则该环境称为可访问环境,否则称为不可访问环境。
一个空房间,其状态可以通过其温度来定义,这是可访问环境的一个示例。
关于地球上事件的信息是无法访问的环境的一个例子。