Agentes Inteligentes Key Note 2007

Intelligent Agents
Agentes Inteligentes
Universidad Técnica Particular de Loja
Advanced Technology Computing Group
Nelson Piedra, Janneth Chicaiza, María Belén Mora

C ATCG.UTPL
bnla
www.utpl.edu.ec
Computer Science School - Intelligence Artifitial Fundamentals 2007 Course

1

Agentes y su entorno
2

entorno

Agentes y su
entorno

actuadores
sensores
?
Un agente es cualquier cosa
agente
capaz de percibir su percepciones acciones
medioambiente con la ayuda
de sensores y actuar en ese
medio utilizando actuadores.

figura 1, agentes y su entorno

3

analogía...
órganos miembros
sensoriales para actuar
ojos, oídos,
AGENTE manos,
piel, nariz,
HUMANO piernas, boca
sinestesia
figura 1, agentes y su entorno
entradas componentes
sensoriales para actuar
presentación
tecleo, ﬁles, AGENTE monitor, envío
paquetes ROBOT paquetes

visitar:
http://es.wikipedia.org/wiki/Sentido
http://es.wikipedia.org/wiki/Sinestesia
4

hipótesis general: un agente puede
percibir sus propias acciones, pero no
siempre sus efectos

5

Un agente tomará una decisión en un
momento dado dependiendo de la
secuencia completa de percepciones
hasta ese instante

f (percepciones(acciones)) = comportamiento
Entorno

Acciones
Comportamiento
Función de
percepciones

6

f de caracterización externa
comportamiento
percepción a percepción b percepción c percepción n

acción a X X X

acción b X X

acción c X X

acción n X X

7

Función y Programa de
un Agente

8

un Agente

• La función de un agente es una
descripción matemática abstracta.

8

un Agente

• La función de un agente es una
descripción matemática abstracta.
• El programa el agente es una
implementación completa, que se
ejecuta sobre la arquitectura del agente.

8

A B

Aspiradora percibe el
cuadrante en el que
está y si hay o no
suciedad.
figura 2, el mundo de la aspiradora
Elige entre moverse a
la izquierda, derecha,
aspirar la suciedad o
no hacer nada

figura 3, tabla parcial para el mundo de la aspiradora
9

A B

cuadrante en el que
está y si hay o no
suciedad.
[A, limpio] Derecha la izquierda, derecha,
no hacer nada

9

A B

cuadrante en el que
está y si hay o no
suciedad.
[A, sucio] Aspirar
no hacer nada

9

A B

cuadrante en el que
está y si hay o no
suciedad.
[A, sucio] Aspirar
no hacer nada
[B, limpio] Izquierda

9

A B

cuadrante en el que
está y si hay o no
suciedad.
[A, sucio] Aspirar
no hacer nada
[B, sucio] Aspirar

9

A B

cuadrante en el que
está y si hay o no
suciedad.
[A, sucio] Aspirar
no hacer nada
[B, sucio] Aspirar
[A, limpio], [A, limpio] Derecha

9

A B

cuadrante en el que
está y si hay o no
suciedad.
[A, sucio] Aspirar
no hacer nada
[B, sucio] Aspirar
[A, limpio], [A, sucio] Aspirar

9

A B

cuadrante en el que
está y si hay o no
suciedad.
[A, sucio] Aspirar
no hacer nada
[B, sucio] Aspirar
[A, limpio], [A, limpio], [A, limpio] Derecha

9

A B

cuadrante en el que
está y si hay o no
suciedad.
[A, sucio] Aspirar
no hacer nada
[B, sucio] Aspirar
[A, limpio], [A, limpio], [A, limpio] Derecha
[A, limpio], [A, limpio], [A, sucio] Aspirar
9

¿Qué hace que un agente sea bueno o
malo, inteligente o estúpido?

10

Buen comportamiento:
el concepto de racionalidad

11

Un agente racional es aquel que
hace lo correcto.

12

hace lo correcto.

¿Qué es hacer los correcto?:

12

hace lo correcto.

Es obtener el mejor resultado; por tanto es
necesario medir el grado de éxito

12

hace lo correcto.

Es obtener el mejor resultado; por tanto es
necesario medir el grado de éxito
Las medidas de rendimiento incluyen los
criterios que determinan el éxito en el
comportamiento del agente.

12

Hay que contar con medidas de
rendimiento objetivas.

Se puede preguntar al agente por su
opinión subjetiva acerca de su propia
actuación, pero muchos agentes serían
incapaces de contestar, y otros podrían
engañarse a sí mismos.

La selección de medidas de
rendimiento no es siempre fácil.

13

¿Qué es mejor, una vida
temeraria con altos y bajos, o
una existencia segura pero
aburrida?

14

¿Qué es mejor, una economía en
la que todo el mundo es pobre
o una en la que unos son pobres
y otros ricos?

15

¿Cuál es la mejor forma de
limpiar una casa: lento pero
bien, o rápido y mediocre?

16

Racionalidad, depende de:

17

Medida de
Rendimiento
que deﬁne criterio
de éxito

17

Medida de
Rendimiento
de éxito
Conocimiento
del medio
acumulado por el
agente

17

Medida de
Rendimiento
de éxito
Conocimiento
del medio
acumulado por el
agente

Secuencia
de Percepciones
del agente hasta ese
moment

17

Medida de
Rendimiento
de éxito
Conocimiento
del medio
acumulado por el Acciones que
agente puede ejecutar
el agente
Secuencia
de Percepciones
del agente hasta ese
moment

17

Agente racional,
deﬁnición

18

Agente racional,
deﬁnición
• En cada posible secuencia de
percepciones, un agente racional deberá
emprender aquella acción que
supuestamente maximice su medida de
rendimiento, basándose en las evidencias
aportadas por la secuencia de
percepciones y en el conocimiento que el
agente mantiene.

18

¿Se puede considerar agente
racional el usado en el problema
de la aspiradora?

19

Depende!! para que lo sea, se
han de deﬁnir la medida de
rendimiento, características del
entorno, determinar los
sensores y actuadores del
agente

20

• La medida de rendimiento premia con un punto al agente
por cada recuadro limpio en un periodo de tiempo
concreto, a lo largo de una ciclo de 1000 periodos

21

• La geografía del medio se conoce a priori, pero la
distribución de la suciedad y localización inicial del agente
no se conocen. Las cuadrículas se mantienen limpias y
aspirando se limpia la cuadrícula en que se encuentre el
agente.

21

agente.
• Las acciones Izquierda y Derecha mueven al agente hacia la
izquierda y derecha excepto en el caso de que ello pueda
llevar al agente fuera del recinto, en este caso el agente
permanece donde se encuentra.

21

agente.
• Las únicas acciones permitidas son Izquierda, Derecha,
Aspirar y NoOperar

21

agente.
• Las únicas acciones permitidas son Izquierda, Derecha,
Aspirar y NoOperar
• El agente percibe correctamente su localización y si esta
localización contiene suciedad

21

Ominisciencia,
aprendizaje y autonomía

22

Ominisciencia,
• Racionalidad versus Omnisciencia

22

Ominisciencia,
• Un agente omnisciente conoce el resultado
de su acción y actúa de acuerdo con él.

22

Ominisciencia,
• Según la deﬁnición propuesta, la racionalidad
no requiere omnisciencia, ya que la elección
racional depende sólo de la secuencia de
percepción hasta la fecha.

22

Ominisciencia,
• Según la deﬁnición propuesta, la racionalidad
no requiere omnisciencia, ya que la elección
racional depende sólo de la secuencia de
percepción hasta la fecha.
• En realidad, la omnisciencia no es posible
22

un poco de cultura...

23

La discusión de la predestinación implica generalmente la
consideración de si Dios es omnisciente, o eterno o
atemporal (fuera del ﬂujo del tiempo en nuestro universo). En
términos de estas ideas, Dios puede VER el pasado, el
presente y el futuro, para que Dios sepa efectivamente el
futuro.

23

futuro.
Si Dios en algún sentido SABE tempranamente lo que
sucederá, entonces los acontecimientos en el universo se
predeterminan efectivamente del punto de vista de Dios. Esto
en sí mismo no es predestinación (aunque implique el
determinismo). La predestinación implica que Dios ha
determinado el avance de lo que será el destino de las
criaturas, no que esté simplemente enterado.

23

futuro.
Si Dios en algún sentido SABE tempranamente lo que
sucederá, entonces los acontecimientos en el universo se
predeterminan efectivamente del punto de vista de Dios. Esto
en sí mismo no es predestinación (aunque implique el
determinismo). La predestinación implica que Dios ha
determinado el avance de lo que será el destino de las
criaturas, no que esté simplemente enterado.
http://es.wikipedia.org/wiki/Predestinaci%C3%B3n

23

Racionalidad NO es lo
mismo que perfección.
Racionalidad maximiza el
rendimiento esperado, mientras
la perfección maximiza el
resultado ideal/real.

24

La perfección en agentes es
costosa e imposible a estas
alturas del partido.

Preferir lo imperfecto posible a
lo perfecto imposible.

25

La deﬁnición propuesta de racionalidad no
requiere omnsciencia, ya que la elección
racional depende sólo de la secuencia
de perfección hasta la fecha.

Es necesario asegurarse de no haber
permitido, por descuido, que el agente se
dedique decididamente a llevar a cabo
acciones poco inteligentes.

26

Partes importantes de la
racionalidad
¿Cómo llevar a cabo
acciones con la
intención de modiﬁcar
percepciones futuras?

27

racionalidad
Recopilación de
Información
acciones con la

27

racionalidad
Recopilación de
Información
acciones con la
Exploración

27

racionalidad
Recopilación de
Información
acciones con la
Exploración

Aprendizaje
sobre lo que se está
percibiendo

27

Entorno & Aprendizaje

¿Es
¿Se un poco
Actúa de forma
necesario
conoce el NO!
correcta, es frágil
Aprender?
entorno?
NO!
SI!

SI!

No es Recopila
necesario percibir y información y
aprender aprende

28

La configuración inicial del agente puede
reflejar un conocimiento preliminar del
entorno, pero a medida que el gente
adquiere experiencia éste puede
modificarse y aumentar.

Esto implica que el agente racional, además
de recopilar información, aprenda lo
máximo posible de lo que está percibiendo.

29

Los agentes de éxito dividen las tareas de
calcular la función de agente en tres
periodos diferentes

Pensando en la
siguiente Cuando
Diseño operación se está
del aprendiendo
procesando de la
agente cálculos experiencia
Cálculos iniciales
nuevos cálculos

El Agente decide cómo comportarse

30

Autonomía y Evolución
¿Hay algo común?

Si, ambos implican que se
entreguen parámetros iniciales
vitales y suﬁcientes para que se
pueda evolucionar/progresar.

31

Autonomía
Entorno

Se apoya más en el
conocimiento inicial
que le proporciona el
diseñador

Carece de autonomía

32

Autonomía
Entorno Entorno

Sabe
aprender de sus
Se apoya más en el
percepciones,
conocimiento inicial
compensa el
que le proporciona el
conocimiento
diseñador
incompleto o
parcial

Agente racional autónomo
Carece de autonomía

32

Autonomía en los
agentes

33

Autonomía en los
agentes
• Un agente racional debe ser autónomo, debe saber
aprender a determinar cómo tiene que compensar
el conocimiento incompleto o parcial inicial.

33

Autonomía en los
agentes
• Cuando el agente haya tenido poca o ninguna experiencia, tendrá
que actuar de forma aleatoria a menos que el diseñador
le haya proporcionado ayuda.

33

Autonomía en los
agentes
• Cuando el agente haya tenido poca o ninguna experiencia, tendrá
que actuar de forma aleatoria a menos que el diseñador
le haya proporcionado ayuda.
• Es razonable entregar a los agentes que disponen de
inteligencia artiﬁcial un conocimiento inicial, así como la
capacidad de aprendizaje.

33

Claves con respecto a la
autonomía

34

Claves con respecto a la
autonomía
Después de las suﬁcientes experiencias
de interacción con el entorno, el
comportamiento del agente racional
será efectivamente independiente del
conocimiento que poseía inicialmente.

34

La naturaleza del Entorno
35

Los entornos de trabajo,
son esencialmente los
problemas para los que los
agentes racionales son las
soluciones.

36

Entorno de Trabajo

Rendimiento Sensores

Entorno Actuadores

37

Piense en un Robot
Conductor
La tarea de conducir un automóvil, en su totalidad, es
extremadamente ilimitada

38

Descripción REAS del entorno de trabajo
de un taxista automático

39

Tipo de
agente

Taxista

39

Tipo de Medidas de
agente rendimiento

Seguro,
rápido, legal,
viaje
Taxista
confortable,
maximización
de beneﬁcio

39

Tipo de Medidas de
Entorno
agente rendimiento

Seguro,
rápido, legal, Carreteras,
viaje otro tráﬁco,
Taxista
confortable, peatones,
maximización clientes
de beneﬁcio

39

Tipo de Medidas de
Entorno Actuadores
agente rendimiento

Seguro,
Dirección,
acelerador,
Taxista freno, señal,
bocina,
visualizador
de beneﬁcio

39

Tipo de Medidas de
Entorno Actuadores Sensores
agente rendimiento

Cámaras,
sonar,
velocímetro,
Seguro,
Dirección, GPS,
acelerador, tacómetro,
Taxista freno, señal, visualizador
bocina, de la
visualizador aceleración,
de beneﬁcio
sensores de
motor,
teclado

39

Ejemplos de tipos de
Agentes
Tablas de descripción REAS: Rendimiento, Entorno,
Actuadores, Sensores.

40

Ejemplo 1, Sistema de diagnóstico médico

41

Tipo de
agente

Sistema de
diagnóstico
médico

41

Tipo de Medidas de
agente rendimiento

Pacientes
Sistema de
sanos, reducir
diagnóstico
costes,
médico
demandas

41

Tipo de Medidas de
Entorno
agente rendimiento

Pacientes
Sistema de Pacientes,
sanos, reducir
diagnóstico hospital,
costes,
médico personal
demandas

41

Tipo de Medidas de
Entorno Actuadores
agente rendimiento

Visualizar
Pacientes preguntas,
sanos, reducir pruebas,
costes, diagnósticos,
médico personal
demandas tratamientos,
casos

41

Tipo de Medidas de
agente rendimiento

Visualizar Teclado para
Pacientes preguntas, la entrada de
sanos, reducir pruebas, síntomas,
costes, diagnósticos, conclusiones,
médico personal
demandas tratamientos, respuesta de
casos pacientes

41

No es tan importante la
distinción entre un medio real
y artiﬁcial, sino la complejidad
de la relación entre el
comportamiento del agente, la
secuencia de percepción generada
por el medio y la medida de
rendimiento

42

Ejemplo 2, Sistema de análisis de imágenes
de satélites

43

de satélites
Tipo de
agente

Sistema de
análisis de
imágenes de
satélites

43

de satélites
Tipo de Medidas de
agente rendimiento

Sistema de
Categorización
análisis de
de imagen
imágenes de
correcta
satélites

43

de satélites
Tipo de Medidas de
Entorno
agente rendimiento

Sistema de Conexión
Categorización
análisis de con el
de imagen
imágenes de satélite en
correcta
satélites órbita

43

de satélites
Tipo de Medidas de
Entorno Actuadores
agente rendimiento

Categorización Visualizar la
análisis de con el
de imagen categorización
correcta de una escena
satélites órbita

43

de satélites
Tipo de Medidas de
agente rendimiento

Categorización Visualizar la Matriz de
análisis de con el
de imagen categorización pixeles de
correcta de una escena colores
satélites órbita

43

Ejemplo 3, Robot para la selección de
componentes

44

componentes
Tipo de
agente

Robot para la
selección de
componentes

44

componentes
Tipo de Medidas de
agente rendimiento

Porcentaje de
Robot para la componentes
selección de clasiﬁcados en
componentes los cubos
correctos

44

componentes
Tipo de Medidas de
Entorno
agente rendimiento

Porcentaje de Cinta
Robot para la componentes transportador
selección de clasiﬁcados en a con
componentes los cubos componentes
correctos cubos

44

componentes
Tipo de Medidas de
Entorno Actuadores
agente rendimiento

Porcentaje de Cinta
Robot para la componentes transportador
Brazo y mano
selección de clasiﬁcados en a con
articulados
componentes los cubos componentes
correctos cubos

44

componentes
Tipo de Medidas de
agente rendimiento

Porcentaje de Cinta
Robot para la componentes transportador Cámara,
Brazo y mano
selección de clasiﬁcados en a con sensor
articulados
componentes los cubos componentes angular
correctos cubos

44

Ejemplo 4, Controlador de una reﬁnería

45

Tipo de
agente

Controlador
de una
reﬁnería

45

Tipo de Medidas de
agente rendimiento

Maximizar la
Controlador
pureza,
de una
producción y
reﬁnería
seguridad

45

Tipo de Medidas de
Entorno
agente rendimiento

Maximizar la
Controlador
pureza, Reﬁnería,
de una
producción y operadores
reﬁnería
seguridad

45

Tipo de Medidas de
Entorno Actuadores
agente rendimiento

Maximizar la Válvulas,
Controlador
pureza, Reﬁnería, bombas,
de una
producción y operadores calentadores,
reﬁnería
seguridad monitores

45

Tipo de Medidas de
agente rendimiento

Maximizar la Válvulas, Temperatura,
Controlador
pureza, Reﬁnería, bombas, presión,
de una
producción y operadores calentadores, sensores
reﬁnería
seguridad monitores químicos

45

Ejemplo 5, Tutor de inglés interactivo

46

Tipo de
agente

Tutor de
inglés
interactivo

46

Tipo de Medidas de
agente rendimiento

Maximizar la
Tutor de puntuación de
inglés los
interactivo estudiantes en
los exámenes

46

Tipo de Medidas de
Entorno
agente rendimiento

Maximizar la
Conjunto de
estudiantes,
inglés los
agencia
examinadora
los exámenes

46

Tipo de Medidas de
Entorno Actuadores
agente rendimiento

Maximizar la
Conjunto de Visualizar los
estudiantes, ejercicios,
inglés los
agencia sugerencias,
examinadora correcciones
los exámenes

46

Tipo de Medidas de
agente rendimiento

Maximizar la
Conjunto de Visualizar los
estudiantes, ejercicios, Teclado de
inglés los
agencia sugerencias, entrada
examinadora correcciones
los exámenes

46

Welcome to Softbots, the homepage for
research in intelligent software agents for the
Internet at the University of Washington's
Department of Computer Science and
Engineering

http://www.cs.washington.edu/research/projects/WebWare1/www/softbots/softbots.html

http://www.links2go.com/LinksSearch?q=Agents
http://www.youtube.com/user/therobotchannel

Softbots:
1. Piense en un piloto automático de vuelo
2. Robot buscador de links relevantes en la web
dotados de procesamiento de lenguaje natural

47

Propiedades de los
entornos de trabajo

48

Propiedades de los
entornos de trabajo
• Totalmente observable vs parcialmente observable

48

Propiedades de los
entornos de trabajo
• Determinista vs estocástico

48

Propiedades de los
entornos de trabajo
• Episódico vs secuencial

48

Propiedades de los
entornos de trabajo
• Estático vs dinámico

48

Propiedades de los
entornos de trabajo
• Discreto vs continuo

48

Propiedades de los
entornos de trabajo
• Discreto vs continuo
• Agente individual vs multiagente
48

Totalmente observable/accesible
vs parcialmente observable

49

Totalmente observable Parcialmente observable

49


Acceso completo del medio y en
cada momento

Parcialmente observable debido al
ruido y a la existencia de sensores
poco exactos o que no reciben
información de parte del sistema

49


cada momento
Los sensores detectan los aspectos
que son relevantes para la toma de Parcialmente observable debido al
decisiones ruido y a la existencia de sensores
poco exactos o que no reciben
información de parte del sistema

49


cada momento
La relevancia, en cada momento, poco exactos o que no reciben
depende de las medidas de información de parte del sistema
rendimiento

49


cada momento
La relevancia, en cada momento, poco exactos o que no reciben
depende de las medidas de información de parte del sistema
rendimiento
Son convenientes porque el agente
no necesita mantener un estado
interno para saber del mundo

49

Determinista Vs Estocástico

50

Determinista Estocástico

50

Cuando es difícil mantener
Si el siguiente estado del medio está totalmente
determinado por el estado actual y la acción
constancia de todos los aspectos
ejecutada por el agente, entonces se dice que el
observados
entorno es determinista

50

observados

No hay incertidumbre si el ambiente Si el medio es parcialmente
es totalmente observable y observable puede parecer
determinista estocástico

50

observados

Es mejor pensar pensar en entornos deterministas o estocásticos desde el
punto de vista del agente

50

observados

Es mejor pensar pensar en entornos deterministas o estocásticos desde el
punto de vista del agente

Si el medio es determinista, excepto para las acciones de otros agentes,
decimos que el medio es estratégico

50

Episódico vs Secuencial

51

Episódico Secuencial

51

En un entorno de trabajo episódico,
la decisión presente puede afectar las
la experiencia del agente se divide en
decisiones futuras
episodios atómicos

51

decisiones futuras
episodios atómicos
Cada episodio consiste en la
Las acciones a corto plazo pueden
percepción del agente y la realización
tener consecuencias a largo plazo
de una única acción posterior.

51

decisiones futuras
episodios atómicos
El siguiente episodio no depende de
Son más complejos que los
las acciones que se realizaron en
episódicos
episodios previos

51

decisiones futuras
episodios atómicos
El siguiente episodio no depende de
Son más complejos que los
las acciones que se realizaron en
episódicos
episodios previos
La elección de la acción en cada
Se necesita “pensar” teniendo en
episodio depende sólo del episodio
cuenta Tiempo
en sí mismo

51

Estático Vs Dinámico

52

Estático Dinámico

52

Estático Dinámico

Los medios estáticos son fáciles de El entorno puede cambiar cuando el
agente esté deliberando.
tratar ya que el agente no necesita
estar pendiente del mundo Estos medios están preguntando
continuamente al agente qué
mientras está tomando una decisión
sobre una acción, ni necesita quiere hacer; sino se ha decidido,
preocuparse sobre el paso del se entiende que ha decidido no hacer
tiempo. nada.

52

Estático Dinámico

Los medios estáticos son fáciles de El entorno puede cambiar cuando el
agente esté deliberando.
tratar ya que el agente no necesita
estar pendiente del mundo Estos medios están preguntando
continuamente al agente qué
mientras está tomando una decisión
sobre una acción, ni necesita quiere hacer; sino se ha decidido,
preocuparse sobre el paso del se entiende que ha decidido no hacer
tiempo. nada.

Si el entorno no cambia con el paso del tiempo, pero el rendimiento del
agente cambia, entonces se dice que el medio es semidinámico.

52

Discreto Vs Continuo

53

Discreto Continuo

53

Discreto Continuo

El estado del medio, en que se maneja el tiempo y a las percepciones/
acciones del agente.

53

Agente Individual Vs Multiagente

54

Agente Individual MultiAgente

54

Agente Individual MultiAgente

Una entidad puede percibirse como un agente
Maximización de rendimiento de Agente 1 están en función del Agente 2

54

Multi Agente Competitivo y
Cooperativo

55

Cooperativo
MultiAgente Competitivo MultiAgente Cooperativo

55

Cooperativo
MultiAgente Competitivo MultiAgente Cooperativo

¿El agente A intenta maximizar su rendimiento
a costa del rendimiento del otro agente B?
Cuál es el proceso de comunicación entre agente

55

El caso más complejo es el parcialmente
observable, estocástico, secuencial,
dinámico, continuo y multiagente

Las situaciones reales son tan complejas
que sería discutible clasiﬁcarlas como
realmente deterministas, a efectos
prácticos se deben tratar como
estocásticas

56

Ejemplos de entornos de trabajo y sus características

57


Entornos de trabajo Observable Determinista Episódico Estático Discreto Agentes

57



Crucigrama Totalmente Determinista Secuencial Estático Discreto Individual

57




Ajedrez con reloj Totalmente Estratégico Secuencial Semi Discreto Multi

57





Póker Parcialmente Estratégico Secuencial Estático Discreto Multi

57






Backgammon Totalmente Estocástico Secuencial Estático Discreto Multi

57







Taxi circulando Parcialmente Estocástico Secuencial Dinámico Continuo Multil

57








Diagnóstico médico Parcialmente Estocástico Secuencial Dinámico Continuo Individual

57









Análisis de imagen Totalmente Determinista Episódico Semi Continuo Individual

57










Robot Clasificador Parcialmente Estocástico Episódico Dinámico Continuo Individual

57











Controlador de refinaría Parcialmente Estocástico Secuencial Dinámico Continuo Individual

57











Controlador de refinaría Parcialmente Estocástico Secuencial Dinámico Continuo Individual

Tutor interactivo de inglés Parcialmente Estocástico Secuencial Dinámico Discreto Multi

57

Estructura de los Agentes
58

= +
Agente Arquitectura Programa

La IA, se centra en diseñar el programa
que implemente la función del agente que
proyecta las percepciones en las acciones.
59

Sensores

Fotoeléctricos Proximidad Humedad

Tablero
Sensores
60

Ejemplo Construcción
http://www.gia.usb.ve/robotica/telemaco/construccion.htm

El primer paso para la construcción del robot es armar el chasis.
Esta es la estructura de soporte donde se emplazaran el resto de
las partes. Esta estructura debe ser rígida y capaz de sostener el
peso que se le va a colocar.
61

Una de la parte más importante del armado del robot es colocar los sensores. Estos
deben ser protegidos contra el ruido propio que provee el ambiente donde el robot se
inte-relaciona. El montaje involucra tres fases:

1. Montaje de Fotoceldas: Estas se 2. Sensor lineal: se colocan en las
colocan en una torre que permite bocas triangulares del robot para
obtener una mejor panorámica al detectar la interrupción que
rango de visión del sensor. produce la entrada de una pelota.

62

4. Sensores de impacto: Estos
3. Sensores de color: Este sensor
sensores, colocados en el
permitirá identiﬁcar el color de la
parachoque, permiten detectar si
pelota capturada. Se coloca en la
ha ocurrido una colisión frontal.
parte de tope de la boca de
captura.

63

Programas de los
agentes
• Reciben las percepciones actuales como entradas
de los sensores y devuelven una acción a los
actuadores
• Los programas reciben sólo la percepción actual
como entrada porque no hay nada más disponible
en el entorno.
• Si las acciones del agente dependen de la secuencia
completa de percepciones, el agente tendría que
recordar las percepciones.

64

Función agente dirigido mediante tabla
función agente-dirigido-mediante tabla (percepción) devuelve una
acción
variables estáticas:
percepciones, una secuencia, vacía inicialmente
tabla, una tabla de acciones, indexada por las secuencias de
percepciones, totalmente deﬁnidas inicialmente

añadir la percepción al ﬁnal de las percepciones
acción <- Consulta (percepciones, tabla)

devolver acción

El programa Agente-Dirigido-Mediante tabla se invoca con cada
nueva percepción y devuelve una acción en cada momento.
Almacena la secuencia de percepciones utilizando su propia
estructura de datos privada

65

Tipos básicos de
problemas para agentes

66

Tipos básicos de

• Agentes reactivos simples

66

Tipos básicos de

• Agentes reactivos basados en modelos

66

Tipos básicos de

• Agentes basados en objetivos

66

Tipos básicos de

• Agentes basados en objetivos
• Agentes basados en utilidad

66

El reto: convertirlos en
agentes que puedan
aprender

67

Agentes reactivos
simples
• Son simples pero poseen un inteligencia muy limitada.

• Seleccionan las acciones sobre la base de las percepciones
actuales, ignorando el resto de las percepciones históricas

• Se usan reglas de condición - acción (situación - acción,
producción, o regla sí - entonces).

• A veces los bucles inﬁnitos son inevitables; se puede salir
seleccionando alguna acción aleatoriamente, sin embargo en
los entornos simples esto no es un comportamiento
racional.

68

Función agente aspiradora

función agente-aspirador-reactivo ([localización, estado]) devuelve
una acción
Si: estado = Sucio Entonces devolver Aspirar
Caso Contrario,
SI localización = A Entonces devolver Derecha
Caso Contrario,
SI localización = B Entonces devolver Izquierda

69

Diagrama esquemático de un
agente reactivo simple
Agent

Environment
70

Agent
Sensors

Environment
70

Agent
Sensors

Environment
What the world
is like now

70

Agent
Sensors

Environment
What the world
is like now

What action I
should do now

70

Agent
Sensors

Environment
What the world
is like now

Condition-Action What action I
Rules should do now

70

Agent
Sensors

Environment
What the world
is like now

Rules should do now

Actuators

70

Un agente reactivo simple

función agente-reactivo-reactivo (percepción) devuelve una
acción
Estático: Reglas, un conjunto de reglas condición-acción

estado <- Interpretar-Entrada (percepción)
regla <- Regla-Coincidencia (estado, reglas)
acción <- Regla-Acción [regla]

devolver acción

funcionará sólo si se puede tomar la decisión correcta sobre la
base de la percepción actual, lo cual es posible sólo si el entorno es
totalmente observable

71

Agentes reactivos
basados en modelos

• La forma más efectiva de manejar las visibilidad parcial es
almacenar información de las partes del mundo que no
pueden ver (manteniendo algún estado interno,
dependiente de la historia percibida)

• Conocimiento sobre como funciona el mundo, esto es del
modelo del mundo.

72

Actualización de la información de estado
interno, requiere codiﬁcar

Información acerca de
Información sobre cómo
cómo evoluciona el
afecta al mundo las
mundo independientemente
acciones del agente
del agente

73

Diagrama esquemático agente
reactivo basado en modelos
Agent
Sensors
State

Environment
How the world evolves What the world
is like now
What my actions do

Rules should do now

Actuators

74

Diagrama esquemático de
agente basado en Objetivos
Agent
Sensors
State

Environment
How the world evolves What the world
is like now
What my actions do
What it will be like if I
do action A

Rules should do now

Actuators

75

Diagrama esquemático de
agente basado en Utilidad
Agent Sensors
State
How the world evolves

Environment
What the world
is like now
What my actions do
What it will be like if I
do action A

How happy I will be in
such a state

Utility What action I
should do now

Actuators

76

Agentes que aprenden
Performance
standard

Agent
Critic
Sensors

Environment
feedback
Changes
Learning Performance
Element element
Knowledge
learning
goals
Problem
generator
Actuators

77

Universidad Técnica Particular de Loja
Advanced Technology Computing Group
Nelson Piedra, Janneth Chicaiza, María Belén Mora
http://nopiedra.wordpress.com
nopiedra@utpl.edu.ec

C ATCG.UTPL
bnla
www.utpl.edu.ec
Computer Science School - Intelligence Artifitial Fundamentals 2007 Course
78

Agentes Inteligentes Key Note 2007

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (20)

Mehr von Nelson Piedra

Mehr von Nelson Piedra (18)

Kürzlich hochgeladen

Kürzlich hochgeladen (20)

Agentes Inteligentes Key Note 2007