⚙

🔍

🎯

🤖

COLEÇÃO ESCOLA DE LÓGICA MATEMÁTICA

VOLUME 85

INTELIGÊNCIA ARTIFICIAL SIMBÓLICA

Planejamento Automático e Suas Aplicações

Uma abordagem sistemática dos fundamentos do planejamento automático em IA, incluindo representação de estados, algoritmos de busca, heurísticas e aplicações práticas em robótica, jogos e sistemas inteligentes, alinhada com a BNCC.

S

G

A

H

COLEÇÃO ESCOLA DE LÓGICA MATEMÁTICA • VOLUME 85

INTELIGÊNCIA ARTIFICIAL SIMBÓLICA

Planejamento Automático e Suas Aplicações

Autor: João Carlos Moreira

Doutor em Matemática

Universidade Federal de Uberlândia

2025

Coleção Escola de Lógica Matemática • Volume 85

CONTEÚDO

Capítulo 1: Fundamentos do Planejamento Automático 4

Capítulo 2: Representação de Estados e Ações 8

Capítulo 3: Algoritmos de Busca no Espaço de Estados 12

Capítulo 4: Heurísticas e Otimização 16

Capítulo 5: STRIPS e Linguagens de Planejamento 22

Capítulo 6: Planejamento Hierárquico 28

Capítulo 7: Grafos de Planejamento e GraphPlan 34

Capítulo 8: Satisfazibilidade em Planejamento 40

Capítulo 9: Aplicações Práticas e Estudos de Caso 46

Capítulo 10: Tendências e Desenvolvimentos Futuros 52

Referências Bibliográficas 54

Coleção Escola de Lógica Matemática • Volume 85
Página 3

Coleção Escola de Lógica Matemática • Volume 85

Capítulo 1: Fundamentos do Planejamento Automático

Introdução e Contexto Histórico

O planejamento automático representa uma das áreas mais fascinantes e desafiadoras da inteligência artificial simbólica, buscando dotar sistemas computacionais com a capacidade de raciocinar sobre sequências de ações necessárias para alcançar objetivos específicos a partir de situações iniciais conhecidas. Esta disciplina conecta-se intimamente com fundamentos matemáticos de lógica, teoria dos grafos e complexidade computacional, estabelecendo ponte entre raciocínio formal e aplicações práticas em robótica, jogos, sistemas autônomos e assistentes inteligentes.

Historicamente, o planejamento automático emergiu nos primórdios da inteligência artificial com sistemas pioneiros como o General Problem Solver de Newell e Simon na década de 1960, e o STRIPS desenvolvido por Richard Fikes e Nils Nilsson em 1971. Estes trabalhos seminais estabeleceram paradigmas fundamentais que continuam influenciando pesquisas contemporâneas, demonstrando viabilidade de abordagens formais baseadas em representação simbólica de conhecimento e raciocínio lógico sobre ações e seus efeitos.

No contexto educacional brasileiro, particularmente considerando as competências da Base Nacional Comum Curricular para matemática e raciocínio lógico, o estudo do planejamento automático desenvolve habilidades essenciais de modelagem formal, pensamento algorítmico e resolução sistemática de problemas complexos. Estas competências transcendem aplicações específicas em computação, preparando estudantes para enfrentar desafios intelectuais diversos em suas trajetórias acadêmicas e profissionais futuras.

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 4

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Definições e Conceitos Fundamentais

Um problema de planejamento é formalmente definido por uma quádrupla ⟨S, S₀, G, A⟩, onde S representa o conjunto de todos os estados possíveis do mundo, S₀ ∈ S denota o estado inicial conhecido, G ⊆ S especifica o conjunto de estados meta que satisfazem os objetivos desejados, e A constitui o conjunto de ações disponíveis que permitem transições entre estados. Esta formalização matemática rigorosa proporciona base sólida para desenvolvimento de algoritmos de planejamento e análise de suas propriedades teóricas.

Cada estado s ∈ S pode ser representado através de um conjunto de proposições lógicas que descrevem aspectos relevantes da situação atual. Por exemplo, no domínio clássico dos blocos, proposições como On(A,B) indicam que o bloco A está sobre o bloco B, Clear(C) significa que nenhum bloco está sobre C, e OnTable(D) expressa que D está diretamente sobre a mesa. Esta representação proposicional facilita raciocínio automatizado sobre estados e transformações.

As ações em A são tipicamente especificadas através de esquemas que incluem precondições (condições que devem ser satisfeitas no estado atual para que a ação seja aplicável), efeitos (mudanças que a ação produz quando executada), e possivelmente custos associados à execução. A formalização precisa de ações permite que algoritmos de planejamento determinem sistematicamente quais sequências de ações transformam o estado inicial em um estado que satisfaz os objetivos estabelecidos.

Exemplo: Mundo dos Blocos

Consideremos um problema simples com três blocos A, B e C.

Estado Inicial S₀:

• OnTable(A), OnTable(B), On(C,A), Clear(B), Clear(C)

• Interpretação: A e B estão na mesa, C está sobre A, B e C não têm blocos acima

Estado Meta G:

• On(A,B), On(B,C), OnTable(C), Clear(A)

• Interpretação: Torre com C na base, B sobre C, A sobre B

Ações disponíveis:

• Move(x,y,z): mover bloco x de y para z

- Precondições: On(x,y), Clear(x), Clear(z)

- Efeitos: ¬On(x,y), On(x,z), ¬Clear(z), Clear(y)

Plano solução:

1. Move(C,A,Table): remove C de A

2. Move(A,Table,B): coloca A sobre B

3. Move(B,Table,C): coloca B sobre C (com A junto)

Este exemplo ilustra os elementos essenciais: representação de estados, especificação de objetivos, modelagem de ações e construção de sequências que resolvem problemas.

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 5

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Complexidade Computacional do Planejamento

A análise da complexidade computacional dos problemas de planejamento revela desafios teóricos profundos que informam o desenvolvimento de algoritmos práticos. O problema geral do planejamento é PSPACE-completo, significando que no pior caso, o espaço de memória necessário cresce polinomialmente com o tamanho da entrada, mas o tempo de execução pode ser exponencial. Esta classificação posiciona o planejamento entre os problemas computacionalmente mais difíceis estudados em ciência da computação teórica.

Para compreender esta complexidade, consideremos que o número de estados possíveis em um domínio com n variáveis booleanas é 2ⁿ, crescimento exponencial que torna enumeração exaustiva impraticável mesmo para problemas moderadamente grandes. Por exemplo, um quebra-cabeça simples com 15 peças móveis possui aproximadamente 10¹³ estados possíveis, quantidade astronômica que desafia abordagens de busca ingênuas. Esta explosão combinatória motiva desenvolvimento de técnicas sofisticadas de busca heurística e representação compacta de estados.

Apesar desta complexidade teórica intimidadora, muitos problemas práticos de planejamento podem ser resolvidos eficientemente através de algoritmos que exploram estruturas específicas dos domínios, utilizam heurísticas informadas para guiar busca, e empregam técnicas de poda que eliminam ramos improdutivos do espaço de busca sem perder soluções ótimas. Esta discrepância entre pior caso teórico e desempenho prático constitui fenômeno fascinante que continua motivando pesquisas em planejamento automático.

Análise de Crescimento do Espaço de Estados

Consideremos domínios com diferentes quantidades de variáveis booleanas:

Domínio com 10 variáveis:

• Número de estados: 2¹⁰ = 1.024 estados

• Explorável por busca exaustiva em milissegundos

Domínio com 20 variáveis:

• Número de estados: 2²⁰ ≈ 1 milhão de estados

• Ainda tratável com algoritmos eficientes

Domínio com 30 variáveis:

• Número de estados: 2³⁰ ≈ 1 bilhão de estados

• Requer heurísticas para busca eficiente

Domínio com 50 variáveis:

• Número de estados: 2⁵⁰ ≈ 10¹⁵ estados

• Enumeração exaustiva completamente impraticável

Implicações práticas:

• Necessidade de representações compactas de conjuntos de estados

• Importância de heurísticas que focam busca em regiões promissoras

• Valor de decomposição de problemas grandes em subproblemas menores

• Motivação para técnicas de abstração que reduzem dimensionalidade

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 6

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Planejamento Clássico e Suas Restrições

O planejamento clássico opera sob conjunto bem-definido de suposições simplificadoras que tornam o problema tratável computacionalmente enquanto preservam essência dos desafios de raciocínio sobre ações. Estas suposições incluem: ambiente totalmente observável (estado completo é sempre conhecido), determinístico (ações têm efeitos previsíveis e únicos), estático (mudanças ocorrem apenas através de ações do agente), e finito (conjuntos de estados e ações são enumeráveis). Embora restritivas, estas condições aplicam-se surpreendentemente bem a muitos problemas práticos importantes.

Sob o paradigma clássico, assume-se ainda que objetivos são expressos como conjuntos de literais que devem ser verdadeiros simultaneamente no estado final, ações são instantâneas e sequenciais (uma de cada vez), planos são sequências lineares de ações, e tempo é implícito através da ordem das ações. Estas simplificações permitem foco em aspectos lógicos do planejamento sem complicações adicionais de tempo, recursos ou incerteza que caracterizam ambientes mais realísticos mas também mais complexos.

A evolução histórica do campo demonstra progressão gradual desde o planejamento clássico restritivo até extensões que relaxam diversas suposições: planejamento temporal considera duração de ações e restrições temporais, planejamento sob incerteza lida com efeitos probabilísticos, planejamento com observação parcial raciocina sobre estados de crença, e planejamento com múltiplos agentes coordena ações de entidades autônomas que interagem. Estas extensões constroem sobre fundamentos do planejamento clássico, destacando importância de dominar conceitos básicos antes de progredir para variantes mais complexas.

Comparação: Planejamento Clássico vs. Não-Clássico

Cenário: Robô organizando cozinha

Formulação Clássica:

• Estados: localizações de objetos (determinísticas e conhecidas)

• Ações: Move(objeto, origem, destino)

• Efeito: objeto definitivamente muda de origem para destino

• Observação: robô sempre sabe localização exata de tudo

Desafios do Mundo Real:

• Objetos podem escorregar durante movimento (incerteza)

• Sensores têm precisão limitada (observação parcial)

• Ações levam tempo variável (aspecto temporal)

• Humanos podem mover objetos simultaneamente (não-estático)

Extensões Necessárias:

• Planejamento probabilístico: modelar probabilidade de sucesso

• Estados de crença: representar incerteza sobre localização

• Planejamento temporal: coordenar ações com durações

• Planejamento multiagente: considerar ações de humanos

Trade-off:

• Formulação clássica: simples mas menos realística

• Extensões: mais realísticas mas computacionalmente custosas

• Decisão prática: escolher complexidade adequada ao problema

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 7

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Capítulo 2: Representação de Estados e Ações

Representação de Estados

A representação eficiente de estados constitui aspecto crucial para viabilidade computacional de sistemas de planejamento, influenciando diretamente tanto complexidade de memória quanto tempo de execução dos algoritmos. Abordagens clássicas utilizam lógica proposicional, onde cada estado é descrito por conjunto de proposições atômicas que são verdadeiras naquele estado. Por exemplo, o estado de um tabuleiro de xadrez pode ser representado por proposições como EmCasa(peão-branco-1, e2) e Vazio(e4), capturando informação relevante de forma compacta e estruturada.

Lógica de primeira ordem oferece poder expressivo superior através de predicados com variáveis e quantificadores, permitindo generalizações que seriam verbosas em lógica proposicional. A sentença ∀x,y (Adjacente(x,y) → Adjacente(y,x)) expressa simetria da relação de adjacência de forma concisa, enquanto sua tradução proposicional requereria instanciar explicitamente todas as possíveis combinações de localizações. Esta capacidade de abstração torna lógica de primeira ordem especialmente valiosa para domínios com muitos objetos e relações complexas entre eles.

Representações alternativas incluem Diagramas de Decisão Binária (BDDs) que codificam eficientemente grandes conjuntos de estados através de estruturas de grafo compartilhadas, e representações baseadas em restrições que especificam estados implicitamente através de equações e inequações. A escolha da representação adequada depende criticamente das características do domínio específico: problemas com muita simetria beneficiam-se de representações simbólicas compactas, enquanto domínios com propriedades numéricas favorecem abordagens baseadas em restrições ou programação matemática.

Comparação de Representações

Problema: 8 rainhas em tabuleiro de xadrez

Representação Proposicional:

• Variáveis: Rainha(i,j) para cada casa (i,j), 1 ≤ i,j ≤ 8

• Total: 64 variáveis booleanas

• Restrições explícitas: ¬(Rainha(1,1) ∧ Rainha(1,2)), etc.

• Quantidade de restrições: centenas de cláusulas

Representação com Variáveis Inteiras:

• Variáveis: coluna[i] para cada linha i, 1 ≤ i ≤ 8

• Total: 8 variáveis com domínio {1,...,8}

• Restrições: coluna[i] ≠ coluna[j] para i ≠ j

• |coluna[i] - coluna[j]| ≠ |i - j| (diagonais)

Representação com Permutações:

• Estado: permutação de {1,2,...,8}

• Espaço de busca: 8! = 40.320 configurações

• Muito menor que 2⁶⁴ ≈ 10¹⁹ da representação proposicional

Lições:

• Escolha de representação impacta drasticamente eficiência

• Explorar estrutura do problema reduz espaço de busca

• Não há representação universalmente superior

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 8

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Modelagem Formal de Ações

A especificação precisa de ações requer modelagem de três componentes essenciais: precondições que determinam quando a ação é aplicável, efeitos que descrevem mudanças produzidas pela execução, e custos ou durações quando relevantes para planejamento ótimo ou temporal. O formalismo STRIPS clássico representa ações através de listas de precondições (literais que devem ser verdadeiros), lista de adição (literais que se tornam verdadeiros), e lista de deleção (literais que se tornam falsos). Esta representação simples mas poderosa captura semântica operacional de muitas ações práticas.

O problema do frame, identificado por John McCarthy e Patrick Hayes, questiona como especificar compactamente que proposições não mencionadas nas listas de efeitos permanecem inalteradas pela execução da ação. A solução adotada no planejamento clássico assume a suposição do mundo fechado para precondições (o que não é explicitamente verdadeiro é falso) e a hipótese do frame (o que não é explicitamente afetado permanece inalterado). Estas convenções simplificam drasticamente a especificação de ações, evitando necessidade de enumerar todas as propriedades que não mudam.

Linguagens modernas como PDDL (Planning Domain Definition Language) estendem o formalismo básico com tipos, funções numéricas, duração de ações, efeitos condicionais e universalmente quantificados, permitindo modelagem mais expressiva de domínios complexos. Por exemplo, efeitos condicionais capturam situações onde consequências de uma ação dependem de características do estado atual, como uma ação de carregar combustível cujo efeito no nível do tanque depende de quanto combustível havia inicialmente.

Exemplo: Ação de Movimento de Robô

Ação: Mover(robô, origem, destino)

Parâmetros:

• robô: objeto do tipo Robô

• origem: localização do tipo Local

• destino: localização do tipo Local

Precondições:

• Em(robô, origem): robô está na origem

• Adjacente(origem, destino): locais são adjacentes

• Livre(destino): destino não está bloqueado

Efeitos:

• Lista de adição: Em(robô, destino), Livre(origem)

• Lista de deleção: Em(robô, origem), Livre(destino)

Custo:

• Distância(origem, destino) ou constante 1 para busca não-ponderada

Extensão com Efeito Condicional:

• Se Carregando(robô, objeto):

→ Adicionar Em(objeto, destino) e Deletar Em(objeto, origem)

Interpretação:

• Ação só pode ser executada se precondições satisfeitas

• Execução modifica estado conforme listas de efeitos

• Propriedades não mencionadas permanecem inalteradas (frame)

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 9

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Espaço de Estados como Grafo

O espaço de estados de um problema de planejamento pode ser conceitualizado como grafo dirigido onde vértices representam estados possíveis e arestas denotam transições causadas por ações aplicáveis. Formalmente, existe aresta de s para s' rotulada com ação a se e somente se as precondições de a são satisfeitas em s e s' resulta da aplicação dos efeitos de a a s. Esta visualização como estrutura de grafo permite aplicação direta de algoritmos clássicos de teoria dos grafos para encontrar caminhos do estado inicial até estados meta.

O diâmetro deste grafo (maior distância entre quaisquer dois estados conectados) fornece limite inferior no comprimento de planos necessários para resolver instâncias do problema. Domínios com diâmetro pequeno admitem soluções curtas e são tipicamente mais fáceis de resolver, enquanto aqueles com diâmetro grande podem requerer planos extensos. A estrutura de conectividade do grafo - se é fortemente conexo, possui componentes isoladas, ou apresenta estrutura hierárquica - influencia profundamente estratégias eficazes de busca e possibilidade de decomposição do problema.

Na prática, o grafo de estados é raramente construído explicitamente devido ao seu tamanho exponencial. Algoritmos de planejamento operam implicitamente sobre este grafo, gerando apenas estados e transições conforme necessário durante a busca. Esta exploração sob demanda, combinada com heurísticas que guiam busca em direções promissoras, torna possível resolver problemas cujos grafos de estados completos jamais caberiam na memória. Estruturas de dados sofisticadas como tabelas de transposição e bases de dados de padrões armazenam informação compacta sobre regiões já exploradas, evitando recomputação e detectando ciclos.

Análise de Grafo: Mundo dos Blocos com 3 Blocos

Configurações possíveis:

• Número total de estados: 13 configurações distintas

• Estados com torre única de altura 3: 6 permutações

• Estados com torre de altura 2 e bloco isolado: 6 configurações

• Estado com todos os blocos na mesa: 1 configuração

Estrutura do grafo:

• Todos os estados são mutuamente alcançáveis

• Grafo é fortemente conexo

• Diâmetro: máximo 5 movimentos entre configurações extremas

Exemplo de caminho mais longo:

• De: On(A,B), On(B,C), OnTable(C)

• Para: On(C,B), On(B,A), OnTable(A)

• Requer desmonte completo e reconstrução inversa

Propriedades interessantes:

• Simetria: grafo possui autom orfismos por permutação de blocos

• Exploração: aproveitando simetria reduz busca

• Escalabilidade: com n blocos, estados crescem super-exponencialmente

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 10

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Linguagens de Descrição de Domínios

PDDL (Planning Domain Definition Language) emergiu como padrão internacional para especificação de problemas de planejamento, permitindo compartilhamento de domínios entre diferentes sistemas e comparação objetiva de desempenho de algoritmos. Desenvolvida originalmente para a primeira Competição Internacional de Planejamento em 1998, PDDL evoluiu através de múltiplas versões que adicionaram expressividade para capturar aspectos como tempo, recursos numéricos, efeitos probabilísticos e objetivos de trajetória. Esta padronização catalisou progresso significativo no campo ao facilitar benchmarking sistemático e colaboração internacional.

A estrutura básica de PDDL separa especificação do domínio (tipos de objetos, predicados, e esquemas de ações) da especificação do problema (objetos específicos, estado inicial, e objetivos). Esta separação modular permite reutilização de domínios com diferentes instâncias de problemas, facilitando desenvolvimento incremental e testes sistemáticos. Predicados como (at ?robô ?local) usam variáveis prefixadas com interrogação que são instanciadas durante o planejamento, enquanto esquemas de ações especificam precondições e efeitos usando fórmulas lógicas sobre esses predicados.

Extensões modernas incluem PDDL 2.1 para planejamento temporal e numérico, PDDL 2.2 para objetivos derivados e níveis de temporização, e PDDL 3.0 para preferências e restrições de trajetória. Estas adições expandem aplicabilidade da linguagem para domínios complexos como agendamento de produção industrial, onde durações e consumo de recursos são cruciais, e planejamento urbano, onde múltiplos objetivos concorrentes devem ser balanceados através de funções de preferência sofisticadas.

Exemplo: Especificação PDDL Simplificada

Definição de Domínio (Logística):

(define (domain logistica)
 (:types caminhao pacote local)
 (:predicates
 (em ?obj - pacote ?loc - local)
 (dentro ?p - pacote ?c - caminhao)
 (localizado ?c - caminhao ?loc - local))
 (:action carregar
 :parameters (?p - pacote ?c - caminhao ?l - local)
 :precondition (and (em ?p ?l) (localizado ?c ?l))
 :effect (and (dentro ?p ?c) (not (em ?p ?l)))))

Definição de Problema:

(define (problem entrega1)
 (:domain logistica)
 (:objects c1 - caminhao p1 p2 - pacote
 cidadeA cidadeB - local)
 (:init (localizado c1 cidadeA)
 (em p1 cidadeA) (em p2 cidadeA))
 (:goal (and (em p1 cidadeB) (em p2 cidadeB))))

Interpretação:

• Domínio define vocabulário e operações gerais

• Problema especifica cenário concreto com objetivos

• Planejador encontra sequência de ações que satisfaz meta

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 11

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Capítulo 3: Algoritmos de Busca no Espaço de Estados

Busca em Profundidade e Busca em Largura

Algoritmos de busca não-informada exploram sistematicamente o espaço de estados sem utilizar conhecimento específico do domínio além da definição de ações e teste de meta. A busca em largura expande estados em ordem de distância crescente do estado inicial, garantindo encontrar solução de comprimento mínimo quando existe. Este algoritmo mantém fila FIFO de estados pendentes, expandindo todos os estados a distância d antes de considerar estados a distância d + 1. A completude e otimalidade da busca em largura vêm ao custo de memória exponencial, tornando-a impraticável para problemas com fatores de ramificação altos.

Busca em profundidade explora um caminho até seu limite antes de retroceder, usando pilha LIFO que requer memória proporcional apenas à profundidade explorada. Esta eficiência espacial permite exploração de espaços muito grandes, mas sacrifica garantias de completude em grafos com ciclos e de otimalidade sempre. Variantes como busca em profundidade limitada impõem limite máximo de profundidade para evitar exploração infinita, enquanto busca em profundidade iterativa combina eficiência espacial da busca em profundidade com completude e otimalidade da busca em largura através de séries de buscas com limites crescentes.

A escolha entre estratégias de busca depende criticamente das características do problema: fator de ramificação (número médio de sucessores por estado), profundidade da solução, distribuição de soluções no espaço, e restrições computacionais de tempo e memória. Problemas com soluções rasas mas muitos estados intermediários favorecem busca em largura, enquanto aqueles com espaços profundos mas ramificação limitada beneficiam-se de busca em profundidade. Análise empírica e teórica de complexidade informa seleção apropriada para domínios específicos.

Comparação: BFS vs. DFS

Problema: Quebra-cabeça dos 8 peças

Busca em Largura (BFS):

• Nível 0: estado inicial (1 estado)

• Nível 1: movimentos possíveis (2-4 estados)

• Nível 2: estados alcançáveis em 2 movimentos (4-16 estados)

• Memória: armazena todos os estados até nível atual

• Vantagem: encontra solução ótima de 20 movimentos

• Desvantagem: pode precisar armazenar 10⁶ estados

Busca em Profundidade (DFS):

• Explora caminho: s₀ → s₁ → s₂ → ... → sₙ

• Memória: armazena apenas caminho atual (≈ 100 estados)

• Vantagem: baixíssimo consumo de memória

• Desvantagem: pode encontrar solução de 1000 movimentos

Busca em Profundidade Iterativa (IDS):

• Limite 1: busca até profundidade 1

• Limite 2: busca até profundidade 2

• ... continua até encontrar solução

• Combina: memória de DFS + otimalidade de BFS

• Custo: reexpansão compensada por crescimento exponencial

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 12

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Busca A* e Busca de Custo Uniforme

A busca A* representa refinamento fundamental sobre busca cega, utilizando função de avaliação f(n) = g(n) + h(n) que combina custo conhecido g(n) do estado inicial até n com estimativa heurística h(n) do custo de n até meta mais próxima. Estados são expandidos em ordem crescente de f, priorizando caminhos que parecem promissores segundo a heurística. Quando h é admissível (nunca superestima o custo verdadeiro) e consistente (satisfaz desigualdade triangular), A* garante encontrar solução ótima, tornando-se algoritmo de referência para busca informada.

A busca de custo uniforme constitui caso especial de A* onde h(n) = 0, expandindo estados em ordem crescente de custo acumulado g(n). Este algoritmo garante otimalidade sem requerer heurística, mas explora mais estados que A* com heurística informativa. A fila de prioridade mantida por estes algoritmos permite expansão eficiente do estado mais promissor, com complexidade temporal dominada pelo número de estados gerados até encontrar solução. Implementações eficientes usam heaps binários ou estruturas mais sofisticadas como heaps de Fibonacci para operações logarítmicas.

A qualidade da heurística impacta dramaticamente desempenho: heurísticas mais informativas (maiores valores admissíveis) expandem menos estados mas podem requerer mais computação por nó. Este trade-off entre tempo de cálculo heurístico e redução de expansões motiva pesquisa em heurísticas que balanceiam precisão com eficiência computacional. Técnicas como abstração de padrões e landmarks proporcionam métodos sistemáticos para derivar heurísticas informativas automaticamente a partir da especificação do problema.

Exemplo: A* em Planejamento de Rotas

Problema: Rota entre cidades

Estado inicial: São Paulo

Estado meta: Brasília

Heurística h(n): distância em linha reta até Brasília

Expansão passo a passo:

Iteração 1:

• Expande: São Paulo (f = 0 + 872 = 872)

• Gera: Campinas (g=90, h=820, f=910)

• Gera: Rio (g=430, h=930, f=1360)

Iteração 2:

• Expande: Campinas (f = 910)

• Gera: Ribeirão Preto (g=90+240=330, h=680, f=1010)

• Gera: Belo Horizonte (g=90+470=560, h=510, f=1070)

Iteração 3:

• Expande: Ribeirão Preto (f = 1010)

• Gera: Uberlândia (g=330+180=510, h=390, f=900) ★

Por que Uberlândia tem f menor?

• Caminho mais direto: heurística captura direção correta

• A* evita explorar Rio e outras cidades desviadas

• Economia: 60% menos estados expandidos que busca cega

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 13

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Busca Bidirecional e Suas Variantes

A busca bidirecional executa simultaneamente busca progressiva do estado inicial e busca regressiva dos estados meta, terminando quando as duas fronteiras se encontram. Para problemas com fator de ramificação b e profundidade de solução d, a complexidade reduz-se de O(b^d) para O(b^(d/2)), melhoria exponencial que torna tratáveis problemas previamente impossíveis. Esta estratégia requer operadores reversíveis que permitam computar predecessores de estados, condição satisfeita naturalmente em muitos domínios de planejamento onde ações têm inversos bem definidos.

Implementações sofisticadas coordenam as duas buscas através de heurísticas que estimam distância não apenas até estados meta mas também até fronteira oposta, permitindo direcionar esforço para regiões onde encontro é mais provável. Algoritmos como MM (Meet in the Middle) e BAE* (Bidirectional A*) exploram esta ideia, mantendo duas filas de prioridade sincronizadas e detectando encontro através de teste de interseção eficiente. A complexidade adicional de gerenciar duas buscas compensa-se através de reduções dramáticas no tamanho total do espaço explorado.

Desafios específicos incluem escolha de estados iniciais para busca regressiva quando múltiplos estados satisfazem objetivos, detecção eficiente de encontro evitando verificações custosas a cada expansão, e garantia de otimalidade quando as duas buscas usam heurísticas diferentes. Pesquisas recentes desenvolveram critérios de terminação rigorosos que asseguram optimalidade mantendo eficiência, resolvendo questões teóricas sutis sobre quando interromper as buscas após detectar primeiro caminho conectando fronteiras.

Análise: Redução de Complexidade

Problema com fator de ramificação b = 10, profundidade d = 6

Busca Unidirecional:

• Estados expandidos: 1 + 10 + 100 + 1.000 + 10.000 + 100.000

• Total: ≈ 111.111 estados

• Memória: precisa armazenar todos

Busca Bidirecional:

• Busca progressiva até nível 3: 1 + 10 + 100 + 1.000 = 1.111

• Busca regressiva até nível 3: 1 + 10 + 100 + 1.000 = 1.111

• Total: ≈ 2.222 estados

• Redução: 98% menos estados expandidos!

Trade-offs:

• Vantagem: redução exponencial em estados

• Custo: complexidade de gerenciar duas buscas

• Custo: teste de interseção entre fronteiras

• Aplicabilidade: requer operadores reversíveis

Quando usar:

• Problemas com grande fator de ramificação

• Estados meta específicos e conhecidos

• Domínios onde ações têm inversos claros

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 14

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Busca Local e Hill Climbing

Algoritmos de busca local operam mantendo estado corrente e movendo-se para vizinhos que melhoram função objetivo, descartando estados visitados sem manter registros históricos. Esta abordagem minimalista em memória permite escalar para espaços enormes onde busca sistemática seria impossível, ao custo de perder garantias de completude e otimalidade. Hill climbing básico move-se sempre ao melhor vizinho disponível, terminando quando nenhum vizinho melhora a situação atual, potencialmente ficando preso em máximos locais que são subótimos globalmente.

Técnicas para escapar de máximos locais incluem reinícios aleatórios (executar múltiplas tentativas de posições iniciais diferentes), passeios aleatórios ocasionais (aceitar movimentos que pioram temporariamente), e estratégias de plateau walking que permitem movimentos laterais em platôs onde vizinhos têm valor idêntico. Simulated annealing formaliza estas ideias através de esquema probabilístico que aceita movimentos de piora com probabilidade decrescente controlada por parâmetro de "temperatura", permitindo exploração inicial ampla que gradualmente foca em refinamento local.

Aplicações incluem problemas de otimização combinatória onde soluções são configurações complexas avaliadas por função objetivo, como satisfazibilidade booleana (SAT) onde vizinhos correspondem a inversões de variáveis individuais. Algoritmos de busca local para SAT como GSAT e WalkSAT competem favoravemente com métodos sistemáticos em instâncias grandes, demonstrando valor prático de abordagens não-exaustivas que sacrificam garantias teóricas por eficiência empírica em classes relevantes de problemas.

Exemplo: Hill Climbing para N-Rainhas

Problema: 8 rainhas em tabuleiro 8×8

Representação: lista [3,1,7,4,6,0,2,5] indica coluna de cada rainha

Função objetivo h: número de pares de rainhas em conflito

Meta: h = 0 (nenhum conflito)

Execução passo a passo:

Estado inicial aleatório:

• Configuração: [2,4,6,0,3,1,7,5]

• Conflitos: h = 5 pares em conflito

Iteração 1: Testar mover cada rainha

• Melhor movimento: mover rainha da coluna 3

• Nova configuração: [2,4,6,3,3,1,7,5]

• Conflitos: h = 3

Iteração 2:

• Melhor movimento: mover rainha da coluna 5

• Conflitos: h = 1

Iteração 3:

• Melhor movimento: ajuste fino

• Solução: h = 0 ✓

Problema: máximos locais

• Algumas execuções ficam presas em h = 1

• Solução: reiniciar com nova configuração aleatória

• Em média: 3-4 reinícios para resolver 8-rainhas

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 15

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Capítulo 4: Heurísticas e Otimização

Fundamentos de Heurísticas Admissíveis

Heurísticas admissíveis nunca superestimam o custo verdadeiro até o objetivo, garantindo que A* encontre soluções ótimas quando empregadas. Formalmente, h é admissível se h(n) ≤ h*(n) para todo estado n, onde h*(n) denota o custo ótimo real de n até meta mais próxima. Esta propriedade assegura que f(n) = g(n) + h(n) nunca excede o custo de qualquer caminho ótimo passando por n, permitindo que A* possa seguramente descartar ramos cujo valor-f excede o custo da melhor solução já encontrada sem perder otimalidade.

A consistência (ou monotonicidade) constitui propriedade mais forte que admissibilidade, exigindo que h(n) ≤ c(n,a,n') + h(n') para toda ação a aplicável em n levando a n', onde c(n,a,n') denota o custo da ação. Heurísticas consistentes são necessariamente admissíveis, e permitem que A* nunca reexpanda estados, melhorando eficiência. Geometricamente, consistência equivale à desigualdade triangular, garantindo que estimativas de distância não violem propriedades básicas de métricas. Verificação de consistência pode ser automatizada através de análise estática da definição heurística.

O desenvolvimento de heurísticas admissíveis tipicamente inicia com relaxações do problema original: remover restrições que tornam o problema mais fácil resulta em custos de solução que subestimam (ou igualam) custos no problema completo. Por exemplo, permitir que robô se teleporte entre localizações arbitrárias relaxa restrições de adjacência, e o custo de solução neste problema relaxado (distância em linha reta) constitui heurística admissível para problema com restrições topológicas. Esta técnica de relaxação sistemática proporciona metodologia geral para derivação de heurísticas com garantias teóricas.

Exemplo: Heurística de Manhattan

Problema: Quebra-cabeça deslizante 15-puzzle

Estado meta: peças ordenadas de 1 a 15

Relaxação: permitir mover peças através de outras

Heurística resultante: distância de Manhattan

• h(n) = Σ |x_atual - x_meta| + |y_atual - y_meta| para cada peça

Exemplo de cálculo:

• Peça 5 está em (2,1), deve estar em (1,1)

• Distância: |2-1| + |1-1| = 1

• Peça 12 está em (0,3), deve estar em (3,2)

• Distância: |0-3| + |3-2| = 4

• h total: soma para todas as 15 peças

Por que é admissível?

• Cada movimento só pode reduzir distância de uma peça em 1

• Logo, h nunca superestima número mínimo de movimentos

• Na prática: h_Manhattan guia busca muito eficientemente

Comparação com heurística trivial h = 0:

• h = 0: expande ~100.000 estados (busca cega)

• h_Manhattan: expande ~1.000 estados (100× mais eficiente)

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 16

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Heurísticas Específicas de Planejamento

Heurísticas delete-relaxation removem todos os efeitos negativos das ações, criando problema relaxado onde ações apenas adicionam fatos sem nunca removê-los. O comprimento de solução ótima neste problema relaxado (h^{max} ou h^{add} dependendo de como custos são agregados) fornece estimativa admissível do custo real. Esta relaxação é particularmente natural em planejamento pois captura dificuldade de alcançar objetivos enquanto ignora interferências destrutivas entre subobjetivos, balanceando informatividade com tratabilidade computacional da heurística resultante.

A heurística h^{max} calcula para cada fato o custo mínimo de alcançá-lo tomando o máximo sobre ações que o produzem, enquanto h^{add} soma custos de alcançar subobjetivos independentemente. Embora h^{add} não seja admissível devido à contabilização duplicada de custos compartilhados, empiricamente ela frequentemente guia busca de forma mais eficaz que h^{max} ao penalizar estados com muitos objetivos pendentes. A escolha entre estas heurísticas envolve trade-off entre garantias teóricas de otimalidade versus desempenho prático em encontrar soluções rapidamente.

Heurísticas baseadas em landmarks identificam fatos que devem necessariamente ser verdadeiros em algum ponto de qualquer plano válido, proporcionando milestones obrigatórios cuja contagem fornece limites inferiores no comprimento de planos. Por exemplo, para um robô transportar objeto de A para B, o landmark "robô em A" deve preceder "objeto em B" em qualquer solução. Ordenamentos parciais entre landmarks refinam estas estimativas, capturando dependências causais que restringem ainda mais estrutura de soluções válidas. Algoritmos modernos como LAMA exploram sinergias entre múltiplas heurísticas através de ensembles que alternam entre diferentes guias durante a busca.

Comparação: h^{max} vs. h^{add}

Problema de planejamento simples:

Estado atual: ¬A ∧ ¬B ∧ ¬C

Estado meta: A ∧ B ∧ C

Ações disponíveis:

• a₁: alcançar A (custo 5)

• a₂: alcançar B (custo 3, requer A)

• a₃: alcançar C (custo 4, requer A)

Cálculo de h^{max}:

• Custo(A) = 5

• Custo(B) = max(custo pré-requisitos) + 3 = 5 + 3 = 8

• Custo(C) = max(custo pré-requisitos) + 4 = 5 + 4 = 9

• h^{max} = max(5, 8, 9) = 9

Cálculo de h^{add}:

• Custo(A) = 5

• Custo(B) = soma(custos pré-requisitos) + 3 = 5 + 3 = 8

• Custo(C) = soma(custos pré-requisitos) + 4 = 5 + 4 = 9

• h^{add} = soma(8, 9) = 17

Custo real ótimo: 12 (a₁, depois a₂ e a₃ em paralelo)

• h^{max} = 9 ≤ 12 (admissível ✓)

• h^{add} = 17 > 12 (inadmissível, mas mais informativa)

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 17

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Pattern Databases e Abstração

Pattern databases pré-computam soluções ótimas para versões abstratas do problema onde apenas subconjunto de variáveis é considerado, armazenando custos ótimos de todos os estados abstratos possíveis. Durante busca, o custo de alcançar projeção do estado meta no espaço abstrato fornece heurística admissível, pois qualquer solução no problema completo induz solução no problema projetado. Esta técnica transforma tempo de busca em espaço de pré-computação, sendo especialmente eficaz quando mesma pattern database pode ser reutilizada para resolver múltiplas instâncias do mesmo domínio.

A escolha de quais variáveis incluir na abstração impacta dramaticamente qualidade e tamanho da heurística resultante. Padrões pequenos geram heurísticas fracas mas compactas, enquanto padrões grandes fornecem estimativas precisas ao custo de explosão espacial. Técnicas como particionamento aditivo dividem variáveis em grupos disjuntos cujas heurísticas individuais podem ser somadas mantendo admissibilidade, permitindo capturar mais informação sem crescimento exponencial. Seleção automática de padrões através de busca gananciosa sobre espaço de abstrações possíveis otimiza trade-off entre informatividade e custo espacial.

Aplicações incluem domínios como Rubik's Cube onde padrões baseados em subconjuntos de cubies fornecem heurísticas poderosas, e planejamento geral onde projeções sobre subconjuntos de variáveis de estado capturam subestruturas críticas do problema. Implementações modernas usam representações compactas como BDDs ou compressão baseada em simetrias para armazenar pattern databases de bilhões de estados em memória limitada, estendendo aplicabilidade da técnica para problemas de escala industrial.

Exemplo: Pattern Database para 15-Puzzle

Padrão 1: Peças {1, 2, 3, 4} (canto superior esquerdo)

• Espaço abstrato: ignora posições das outras 11 peças

• Estados abstratos: 16 × 15 × 14 × 13 = 43.680 configurações

• Pré-computação: busca regressiva do estado meta abstrato

• Armazenamento: ~40KB para custos de todos estados abstratos

Padrão 2: Peças {5, 6, 7, 8} (canto superior direito)

• Disjunto do Padrão 1: pode ser somado!

• Mesmo tamanho: 43.680 configurações

Padrão 3: Peças {9, 10, 11, 12}

Padrão 4: Peças {13, 14, 15}

Heurística aditiva:

• h(n) = h₁(n) + h₂(n) + h₃(n) + h₄(n)

• Admissível pois padrões são disjuntos

• Extremamente informativa: próxima de h*

Desempenho:

• h_Manhattan: expande ~1.000 estados

• h_PDB aditiva: expande ~100 estados (10× melhor)

• Trade-off: requer 160KB de memória + pré-computação

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 18

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Dominância e Combinação de Heurísticas

Uma heurística h₁ domina h₂ se h₁(n) ≥ h₂(n) para todos os estados n, mantendo ambas admissíveis. A dominância implica que A* com h₁ nunca expande mais estados que com h₂, tornando h₁ estritamente superior para guiar busca. Esta relação de ordem parcial sobre heurísticas admissíveis permite classificação teórica de sua qualidade informativa, embora o custo computacional de avaliar heurísticas mais informativas possa ocasionalmente compensar reduções no número de expansões, criando trade-offs práticos não capturados pela dominância pura.

Quando múltiplas heurísticas admissíveis h₁, h₂, ..., hₖ estão disponíveis, tomar o máximo h(n) = max(h₁(n), h₂(n), ..., hₖ(n)) produz heurística admissível que domina cada componente individual. Esta combinação captura o melhor de múltiplas perspectivas sobre o problema, explorando sinergias onde diferentes heurísticas são mais informativas em diferentes regiões do espaço de estados. Implementações eficientes calculam heurísticas componentes sob demanda, interrompendo avaliação assim que valor suficientemente alto é obtido para decisão de expansão corrente.

Ensembles sofisticados alternam entre heurísticas durante busca baseado em características do estado atual ou histórico de desempenho, adaptando estratégia dinamicamente. Por exemplo, o planejador LAMA alterna entre busca com heurística de landmarks e busca com h^{FF}, explorando complementaridade entre guidance de curto prazo e identificação de estrutura global do problema. Esta meta-raciocínio sobre qual heurística empregar quando constitui área ativa de pesquisa que conecta planejamento clássico com aprendizado de máquina.

Exemplo: Combinação de Heurísticas

Três heurísticas para problema de roteamento:

h₁(n): distância Euclidiana até meta

• Rápida de calcular, sempre subestima

• Admissível: linha reta é caminho mais curto

h₂(n): distância de Manhattan (grid)

• Considera movimento restrito a eixos

• Mais informativa que h₁ em grades ortogonais

h₃(n): custo de caminho mais curto ignorando obstáculos

• Computacionalmente custosa (Dijkstra simplificado)

• Muito informativa, captura topologia

Heurística combinada:

• h(n) = max(h₁(n), h₂(n), h₃(n))

• Garante admissibilidade (máximo de admissíveis)

• Mais informativa que qualquer componente individual

Avaliação prática:

• Estado s₁: h₁=10, h₂=12, h₃=15 → h=15

• Estado s₂: h₁=8, h₂=8, h₃=20 → h=20

• Trade-off: tempo por nó vs. reduções em expansões

Estratégia adaptativa:

• Calcular h₁ e h₂ sempre (rápidas)

• Calcular h₃ apenas se max(h₁,h₂) não resolve decisão

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 19

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Heurísticas Inadmissíveis e Busca Ponderada

Embora heurísticas inadmissíveis sacrifiquem garantias de otimalidade, frequentemente proporcionam guidance mais agressivo que acelera descoberta de soluções satisfatórias quando otimalidade estrita não é crítica. Multiplicar heurística admissível por fator ω > 1 produz busca ponderada que expande estados com f(n) = g(n) + ω·h(n), explorando mais agressivamente direções promissoras ao custo de potencialmente retornar soluções subótimas limitadas por fator de ω. Esta técnica é especialmente valiosa em cenários onde encontrar qualquer solução rapidamente tem mais valor que garantir solução absolutamente ótima.

Algoritmos anytime como Anytime Repairing A* (ARA*) iniciam com peso alto (busca rápida mas potencialmente subótima) e progressivamente reduzem ω em iterações subsequentes, refinando solução até atingir optimalidade se tempo permitir. Esta abordagem fornece solução utilizável rapidamente enquanto melhora qualidade se computação adicional está disponível, adaptando-se flexivelmente a restrições computacionais variáveis. Limitações teóricas sobre suboptimalidade (solução retornada custará no máximo ω vezes o ótimo) fornecem garantias quantificáveis mesmo sem otimalidade estrita.

Domínios com características específicas motivam heurísticas especializadas que violam admissibilidade deliberadamente para capturar estruturas problemáticas particulares. Por exemplo, em planejamento temporal onde ações têm durações, heurísticas que contabilizam tempo crítico de caminho podem superestimar custos em cenários com alto paralelismo mas fornecem guidance superior em problemas fundamentalmente sequenciais. A escolha entre admissibilidade e informatividade pragmática depende criticamente dos requisitos aplicação-específicos sobre qualidade de solução versus tempo de resposta.

Análise: Impacto do Peso ω

Problema de navegação robótica (1000 estados)

A* padrão (ω = 1.0):

• Estados expandidos: 850

• Tempo: 5.2 segundos

• Custo solução: 42 (ótimo)

Busca ponderada (ω = 1.5):

• Estados expandidos: 320

• Tempo: 2.1 segundos (2.5× mais rápido)

• Custo solução: 48 (14% subótimo)

Busca ponderada (ω = 2.0):

• Estados expandidos: 180

• Tempo: 1.3 segundos (4× mais rápido)

• Custo solução: 53 (26% subótimo)

Busca ponderada (ω = 3.0):

• Estados expandidos: 95

• Tempo: 0.8 segundos (6.5× mais rápido)

• Custo solução: 61 (45% subótimo)

Análise do trade-off:

• ω = 1.5: bom equilíbrio prático

• ω = 2.0: aceitável se tempo crítico

• ω > 3.0: soluções podem ser muito ruins

Estratégia anytime:

• Iniciar com ω = 3.0 (solução rápida)

• Refinar com ω = 2.0, depois 1.5

• Finalizar com ω = 1.0 se tempo disponível

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 20

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Aprendizado Automático de Heurísticas

Técnicas de aprendizado de máquina podem automatizar construção de heurísticas através de treinamento em conjuntos de problemas resolvidos previamente, extraindo padrões que correlacionam características de estados com seus custos até objetivos. Abordagens supervisionadas treinam regressores (redes neurais, árvores de decisão, ou SVMs) usando pares ⟨estado, custo-real⟩ obtidos de soluções conhecidas, generalizando para estimar custos em estados não vistos durante treino. Esta automação de engenharia heurística promete escalabilidade para domínios novos onde expertise humana é limitada ou custosa de desenvolver.

O desafio central reside em projetar características (features) de estados que capturem informação relevante para predição de custos mantendo dimensionalidade tratável. Características proposicionais simples (quais fatos são verdadeiros) frequentemente são insuficientes, motivando engenharia de features que conta objetivos não-alcançados, detecta interações entre subobjetivos, ou mede distâncias em grafos de causalidade. Aprendizado de representações através de redes neurais profundas pode automatizar descoberta de features úteis, embora interpretabilidade e garantias teóricas sejam sacrificadas em comparação com heurísticas handcrafted com admissibilidade provável.

Aplicações recentes incluem synthesis de heurísticas para Rubik's Cube usando aprendizado por reforço que supera pattern databases clássicas, e meta-aprendizado que adapta heurísticas durante busca baseado em desempenho observado em estados já expandidos. Estes desenvolvimentos sugerem convergência futura entre planejamento simbólico clássico e técnicas modernas de aprendizado profundo, combinando garantias formais de métodos tradicionais com adaptabilidade e escalabilidade de abordagens data-driven.

Exemplo: Rede Neural para Heurística

Domínio: Sokoban (jogo de empurrar caixas)

Abordagem tradicional:

• Heurística handcrafted: distâncias mínimas caixas-alvos

• Limitação: não captura deadlocks (configurações insolúveis)

Abordagem com aprendizado:

Fase 1: Geração de dados

• Resolver 10.000 problemas Sokoban com A*

• Extrair pares ⟨estado, custo-real⟩ de soluções

• Total: ~1 milhão de exemplos de treinamento

Fase 2: Engenharia de features

• Posição de cada caixa (normalizada)

• Distâncias caixas-alvos mais próximos

• Padrões de bloqueio (canto, parede)

• Configuração local 3×3 ao redor de cada caixa

• Total: ~50 features por estado

Fase 3: Treinamento

• Rede neural: 50 → 128 → 64 → 1

• Função de perda: erro quadrático médio

• Regularização para evitar overfitting

Resultados:

• Correlação com h*: 0.89 (muito boa)

• Desempenho: 30% menos expansões que heurística manual

• Limitação: não garante admissibilidade

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 21

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Capítulo 5: STRIPS e Linguagens de Planejamento

O Formalismo STRIPS Clássico

STRIPS (Stanford Research Institute Problem Solver) estabeleceu paradigma duradouro para representação de problemas de planejamento através de especificação declarativa de ações como operadores com precondições e efeitos. Desenvolvido por Fikes e Nilsson em 1971, este formalismo modela estados como conjuntos de átomos ground (proposições instanciadas sem variáveis), ações como esquemas parametrizados, e mudanças através de listas explícitas de átomos adicionados e deletados. A simplicidade e expressividade deste modelo tornaram STRIPS fundamento conceitual sobre o qual planejadores modernos são construídos.

Um operador STRIPS especifica nome com parâmetros tipados, lista de precondições (conjunção de literais que devem ser verdadeiros para aplicabilidade), lista de adição (átomos que se tornam verdadeiros após execução), e lista de deleção (átomos que se tornam falsos). Por exemplo, o operador Move(r, x, y) para robô movendo-se de x para y teria precondição At(r,x) ∧ Adjacent(x,y), adicionaria At(r,y), e deletaria At(r,x). A suposição do mundo fechado para estados e hipótese do frame para ações simplificam raciocínio, assumindo que tudo não-mencionado é falso e tudo não-afetado permanece inalterado.

O processo de planejamento STRIPS original utilizava busca regressiva means-ends analysis, partindo de objetivos e identificando ações cujos efeitos satisfazem subobjetivos pendentes, recursivamente estabelecendo precondições destas ações como novos subobjetivos. Esta estratégia goal-directed reduz busca cega mas enfrenta dificuldades com interações entre subobjetivos onde alcançar um objetivo pode inadvertidamente destruir outro já estabelecido. Extensões modernas endereçam estas limitações através de técnicas como proteção de literais alcançados e ordenamento flexível de ações para minimizar conflitos destrutivos.

Exemplo Completo: Domínio de Transporte

Operador 1: Carregar(caminhão, pacote, local)

Precondições:

• At(caminhão, local)

• At(pacote, local)

Efeitos:

• ADD: In(pacote, caminhão)

• DEL: At(pacote, local)

Operador 2: Descarregar(caminhão, pacote, local)

Precondições:

• At(caminhão, local)

• In(pacote, caminhão)

Efeitos:

• ADD: At(pacote, local)

• DEL: In(pacote, caminhão)

Operador 3: Dirigir(caminhão, origem, destino)

Precondições:

• At(caminhão, origem)

• Conectado(origem, destino)

Efeitos:

• ADD: At(caminhão, destino)

• DEL: At(caminhão, origem)

Problema exemplo:

• Estado inicial: At(t1, CidadeA), At(p1, CidadeA)

• Meta: At(p1, CidadeB)

Plano solução:

1. Carregar(t1, p1, CidadeA)

2. Dirigir(t1, CidadeA, CidadeB)

3. Descarregar(t1, p1, CidadeB)

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 22

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

ADL e Extensões Expressivas

Action Description Language (ADL) estende STRIPS com construções lógicas mais ricas que aumentam poder expressivo mantendo tratabilidade computacional razoável. ADL permite precondições e efeitos condicionais arbitrários (não apenas conjunções), quantificação universal e existencial sobre objetos, igualdade e desigualdade entre termos, e tipos hierárquicos de objetos. Por exemplo, efeitos condicionais capturam situações onde consequência de ação depende de estado: limpar sala tem efeito Limpo(sala) apenas se ¬Trancado(sala), modelando naturalmente dependências contextuais.

Quantificadores em precondições expressam restrições sobre coleções de objetos: precondição ∀x (EmSala(x, s) → Evacuado(x)) garante que ação de lacrar sala s só é aplicável quando todos os ocupantes foram evacuados. Quantificadores em efeitos especificam mudanças universais: efeito ∀x (EmSala(x,s) → Contaminado(x)) modela que lacrar sala contaminada afeta todos os presentes. Esta expressividade permite modelagem compacta de domínios complexos que requereriam enumeração exaustiva em STRIPS básico.

A compilação de ADL para STRIPS através de grounding instancia todos os quantificadores e predicados para objetos específicos do problema, expandindo representação compacta em conjunto potencialmente exponencial de ações ground. Técnicas de grounding inteligente evitam instanciação de combinações irrelevantes através de análise de reachability que identifica quais instanciações podem aparecer em alguma execução possível. Esta pré-compilação transforma expressividade lógica em estrutura proposicional sobre a qual algoritmos de planejamento eficientes operam, mediando trade-off entre conveniência de modelagem e eficiência computacional.

Exemplo: Efeitos Condicionais em ADL

Ação: AbrirCaixa(robô, caixa, local)

Precondições:

• At(robô, local)

• At(caixa, local)

• ¬Aberta(caixa)

Efeitos:

• Aberta(caixa) [incondicional]

• QUANDO Conteúdo(caixa, tesouro):

→ Tem(robô, tesouro) ∧ ¬Conteúdo(caixa, tesouro)

• QUANDO Conteúdo(caixa, armadilha):

→ Ativada(armadilha) ∧ Danificado(robô)

• QUANDO ¬∃x (Conteúdo(caixa, x)):

→ Vazia(caixa)

Interpretação:

• Efeito da ação depende do conteúdo (desconhecido a priori)

• Modelagem natural de incerteza sobre estado do mundo

• STRIPS precisaria de ações separadas para cada possibilidade

Compilação para STRIPS:

• Gerar três ações ground para cada instância:

- AbrirCaixaComTesouro(r, c, l)

- AbrirCaixaComArmadilha(r, c, l)

- AbrirCaixaVazia(r, c, l)

• Trade-off: expressividade vs. explosão combinatória

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 23

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Fluentes Numéricos e PDDL Avançado

PDDL 2.1 introduziu fluentes numéricos que associam valores reais a aspectos do estado, permitindo modelagem de recursos consumíveis, durações temporais, e métricas contínuas. Um fluente como (combustível ?veículo) retorna valor numérico representando quantidade atual, e ações podem especificar efeitos como (decrease (combustível v1) 10) que modificam estes valores aritmeticamente. Esta extensão amplia dramaticamente aplicabilidade do planejamento para domínios práticos onde quantidades e otimização numérica são essenciais, como logística com restrições de capacidade, agendamento com durações variáveis, e controle de processos industriais.

Precondições sobre fluentes usam comparadores para testar valores: (>= (combustível ?v) 50) requer que veículo tenha pelo menos 50 unidades. Efeitos incluem operações aritméticas arbitrárias: (increase (distância-percorrida ?v) (* (velocidade ?v) (duração ?ação))). Funções de otimização especificam métricas a minimizar ou maximizar, como (:metric minimize (total-cost)) ou (:metric maximize (lucro-total)), transformando planejamento de busca qualitativa (alcançar objetivos) em otimização quantitativa (alcançar objetivos otimizando métricas específicas).

O tratamento de fluentes numéricos introduz complexidades computacionais adicionais pois o espaço de estados torna-se potencialmente infinito e comparações numéricas podem ser indecidíveis em casos gerais. Planejadores práticos restringem expressividade a fragmentos tratáveis, como atualizações lineares de fluentes e precondições com comparações simples, mantendo decidibilidade enquanto capturam a maioria das necessidades de modelagem práticas. Algoritmos como metric-FF estendem técnicas de delete-relaxation para contextos numéricos, computando relaxações onde recursos são ilimitados para derivar heurísticas admissíveis.

Exemplo: Planejamento com Fluentes

Domínio: Entrega com restrição de combustível

Fluentes:

• (combustível ?caminhão): quantidade atual

• (distância ?origem ?destino): distância entre locais

• (carga ?caminhão): peso atual carregado

Ação: Dirigir(?c, ?origem, ?destino)

Precondições:

• (at ?c ?origem)

• (>= (combustível ?c)

(* (distância ?origem ?destino) (consumo-base)))

Efeitos:

• (not (at ?c ?origem))

• (at ?c ?destino)

• (decrease (combustível ?c)

(* (distância ?origem ?destino)

(+ (consumo-base)

(* 0.1 (carga ?c)))))

Ação: Abastecer(?c, ?posto)

Precondições:

• (at ?c ?posto)

• (é-posto ?posto)

Efeitos:

• (assign (combustível ?c) (capacidade-tanque ?c))

Métrica:

• (:metric minimize (+ (total-distância) (* 10 (total-abastecimentos))))

Análise:

• Planejador deve balancear distância vs. paradas para abastecer

• Carga afeta consumo: otimização conjunta de rota e carga

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 24

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Planejamento Temporal e Ações Durativas

PDDL 2.1 introduziu ações durativas que ocupam intervalos temporais ao invés de serem instantâneas, modelando realismo de atividades que consomem tempo como cozinhar, transportar, ou processar materiais. Uma ação durativa especifica condições e efeitos em três timepoints: start (início da execução), over all (durante toda execução), e end (término). Por exemplo, assar bolo requer forno disponível no start, forno ocupado over all, e produz bolo pronto no end. Esta granularidade temporal permite paralelismo controlado onde múltiplas ações executam concorrentemente respeitando dependências e restrições de recursos.

A duração pode ser fixa, variável limitada por inequações, ou dependente de fluentes através de expressões aritméticas. Precondições over all devem permanecer verdadeiras durante toda execução, impedindo interferências destrutivas. Efeitos continuous change modelam mudanças graduais como (increase (temperatura forno) (* #t 50)) onde #t é variável representando tempo decorrido. Estes mecanismos capturam física de processos contínuos impossível de expressar em modelos puramente discretos, aproximando planejamento de controle de sistemas híbridos.

Algoritmos de planejamento temporal como POPF e TempLM estendem técnicas de busca heurística para espaços de estados temporalmente estendidos, mantendo line temporal de ações sobrepostas e verificando consistência de restrições temporais e de recursos. A complexidade aumenta significativamente pois ordenamentos parciais entre ações oferecem flexibilidade que deve ser explorada para encontrar planos válidos, mas também expande dramáticamente o espaço de busca. Técnicas de decomposição temporal e análise de profiles de recursos reduzem complexidade identificando gargalos críticos que constrangem soluções viáveis.

Exemplo: Ação Durativa

Ação: Transportar(?robô, ?objeto, ?origem, ?destino)

Duração:

• (= ?duration (/ (distância ?origem ?destino) (velocidade ?robô)))

Condições START:

• (at ?robô ?origem)

• (at ?objeto ?origem)

• (livre ?robô)

Condições OVER ALL:

• (carregando ?robô ?objeto)

• (>= (bateria ?robô) 10)

Efeitos START:

• (not (at ?objeto ?origem))

• (not (livre ?robô))

• (carregando ?robô ?objeto)

Efeitos CONTINUOUS:

• (decrease (bateria ?robô) (* #t (consumo-energia ?robô)))

Efeitos END:

• (at ?robô ?destino)

• (at ?objeto ?destino)

• (livre ?robô)

• (not (carregando ?robô ?objeto))

Plano temporal exemplo:

• 0.0: START Transportar(r1, caixa1, A, B) [duração: 5.0]

• 2.0: START Transportar(r2, caixa2, C, B) [duração: 3.0]

• 5.0: END Transportar(r1, caixa1, A, B)

• 5.0: END Transportar(r2, caixa2, C, B)

• Paralelismo: r1 e r2 operam simultaneamente

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 25

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Grounding e Compilação de Problemas

O processo de grounding transforma especificação compacta de domínio em linguagem de primeira ordem (com variáveis e quantificadores) em representação proposicional explícita onde todas as variáveis são substituídas por objetos concretos do problema. Para domínio com k esquemas de ações e n objetos, grounding ingênuo pode gerar até k·n^m ações ground onde m é aridade máxima, crescimento que rapidamente torna-se impraticável. Por exemplo, ação Move(?robô, ?origem, ?destino) com 100 localizações e 5 robôs produz 5·100·99 = 49.500 ações ground.

Técnicas de grounding inteligente exploram análise de reachability para identificar e descartar instanciações que nunca podem aparecer em nenhuma execução válida. Análise de tipos estáticos elimina combinações incompatíveis (não tentar mover objetos do tipo Caminhão como se fossem Pacotes), enquanto análise de reachability dinâmica propaga fatos alcançáveis iterativamente, instanciando apenas ações cujas precondições podem ser satisfeitas por estados alcançáveis. Estas técnicas reduzem frequentemente o tamanho do problema ground em várias ordens de magnitude sem perder soluções.

Compilações transformam extensões expressivas como precondições negativas, efeitos condicionais, ou objetivos complexos em fragmentos mais restritos sobre os quais planejadores eficientes operam. Por exemplo, precondições negativas ¬P podem ser substituídas por novas variáveis proposicionais Not-P explicitamente mantidas consistentes através de efeitos de ações. Estas transformações preservam semântica enquanto expõem estrutura que algoritmos especializados exploram eficientemente, ilustrando princípio geral de reduzir problemas complexos a núcleos computacionalmente tratáveis através de pré-processamento inteligente.

Análise: Explosão vs. Redução de Grounding

Domínio de Logística

Esquemas de ações: 4 (Carregar, Descarregar, Dirigir, Voar)

Objetos:

• 10 cidades, 20 locais por cidade (200 locais totais)

• 50 pacotes, 15 caminhões, 3 aviões

Grounding ingênuo:

• Carregar(?c, ?p, ?l): 15·50·200 = 150.000 instâncias

• Dirigir(?c, ?de, ?para): 15·200·200 = 600.000

• Total bruto: > 1 milhão de ações ground

Análise de tipos:

• Caminhões só dirigem dentro da mesma cidade

• Reduz Dirigir para: 15·20·20 = 6.000 (100× redução)

Análise de reachability:

• Pacotes inicialmente em poucas localizações

• Carregar só relevante onde pacotes podem estar

• Reduz Carregar para ~5.000 instâncias

Resultado final:

• ~20.000 ações ground (50× redução total)

• Tempo de grounding: 0.3s vs. memória insuficiente

Impacto no planejamento:

• Problema agora cabe em memória

• Busca heurística viável (antes impossível)

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 26

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Validação e Verificação de Planos

A validação de planos verifica se sequência proposta de ações efetivamente transforma estado inicial em estado que satisfaz objetivos, detectando erros como precondições violadas, ordenamentos temporais inválidos, ou conflitos de recursos. Validadores automatizados executam plano simbolicamente passo-a-passo, mantendo estado corrente e verificando aplicabilidade de cada ação antes de aplicar seus efeitos. Esta verificação independente proporciona confiança adicional em corretude de planejadores, particularmente importante para sistemas safety-critical onde falhas têm consequências graves.

VAL (Validator) constitui ferramenta padrão desenvolvida para competições de planejamento, suportando toda expressividade de PDDL incluindo temporalidade, fluentes numéricos, e efeitos condicionais. Além de validação básica, VAL analisa propriedades como robustez do plano (sensibilidade a pequenas variações em durações ou valores numéricos), detecta potenciais deadlocks em planos concorrentes, e verifica satisfação de invariantes de domínio. Estas análises adicionais identificam fragilidades que poderiam causar falhas durante execução real mesmo quando plano é tecnicamente válido segundo especificação formal.

Verificação formal vai além de validação, provando propriedades mais fortes como corretude independente de estado inicial específico, ausência de deadlocks em todas as execuções possíveis, ou garantia de propriedades temporais como "robô eventualmente retorna à base". Model checking e theorem proving automatizados aplicam-se a verificação de planejadores e planos, complementando testes empíricos com garantias formais. Esta interseção entre planejamento e métodos formais é especialmente relevante para certificação de sistemas autônomos em domínios regulamentados como aeronáutica e medicina.

Exemplo: Validação Detectando Erro

Plano proposto (incorreto):

1. Carregar(t1, p1, CidadeA)

2. Descarregar(t1, p1, CidadeB)

3. Dirigir(t1, CidadeA, CidadeB)

Validação passo-a-passo:

Estado inicial:

• At(t1, CidadeA), At(p1, CidadeA)

Após ação 1:

• At(t1, CidadeA), In(p1, t1) ✓ válido

Tentativa ação 2:

• Precondição: At(t1, CidadeB)

• Estado atual: At(t1, CidadeA)

• ERRO: Precondição violada! ✗

Diagnóstico:

• Ação 2 requer caminhão em CidadeB

• Mas ação 3 (movimento) vem depois

• Ordenamento incorreto das ações

Plano corrigido:

1. Carregar(t1, p1, CidadeA)

2. Dirigir(t1, CidadeA, CidadeB)

3. Descarregar(t1, p1, CidadeB)

Validação do plano corrigido:

• Todas as precondições satisfeitas ✓

• Estado final alcança meta: At(p1, CidadeB) ✓

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 27

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Capítulo 6: Planejamento Hierárquico

Motivação e Fundamentos HTN

Hierarchical Task Network (HTN) planning aborda complexidade do planejamento através de decomposição hierárquica de tarefas complexas em redes de subtarefas progressivamente mais simples até alcançar ações primitivas executáveis. Esta abordagem reflete naturalmente como humanos raciocinam sobre problemas complexos: para viajar de A a B, primeiro decidimos transporte (avião, carro, trem), depois refinamos cada escolha em passos detalhados (comprar passagem, fazer check-in, embarcar). A estrutura hierárquica captura conhecimento sobre estratégias bem-sucedidas, guiando busca mais eficientemente que planejamento puramente ground-level.

Um problema HTN especifica tarefas compostas (não-primitivas) decomponíveis em subtarefas através de métodos que especificam decomposições alternativas, e tarefas primitivas correspondendo a ações do mundo. Métodos incluem precondições determinando quando decomposição é aplicável, e rede de subtarefas com ordenamentos parciais e vínculos entre variáveis. Por exemplo, tarefa composta TransportarPacote tem método usando CaminhãoLocal para destinos próximos e método usando AviãoDistante para destinos remotos, cada qual decompondo-se em sequências específicas de ações primitivas.

A busca HTN explora recursivamente decomposições possíveis, mantendo lista de tarefas pendentes e progressivamente refinando tarefas compostas até obter plano consistindo apenas de ações primitivas. Ordenamentos parciais entre tarefas proporcionam flexibilidade, permitindo entrelaçamento eficiente de subplanos para diferentes objetivos. Esta estrutura naturalmente captura expertise de domínio sobre "melhores práticas", tornando HTN especialmente adequado para domínios onde estratégias eficazes são conhecidas mas espaço de busca para descobri-las automaticamente é proibitivo.

Exemplo: Rede Hierárquica de Tarefas

Tarefa de alto nível: PrepararJantar

Método 1: JantarSimples

Decomposição:

1. FazerSalada

2. CozinharMassaMolho

3. ColocarMesa

Método 2: JantarElaborado

Precondição: TempoDisponível > 90min

Decomposição:

1. PrepararEntrada

2. CozinharPratoPrincipal

3. FazerSobremesa

4. ColocarMesa

Refinamento de FazerSalada:

Método 1: SaladaVerde

• Subtarefas: LavarVegetais, CortarIngredientes, TempararSalada

Método 2: SaladaMista

• Subtarefas: LavarVegetais, CozinharOvos, CortarTudo, Misturar

Ações primitivas:

• LavarVegetais(?v): pegar(?v), lavar-em-pia(?v), secar(?v)

• CortarIngredientes(?i): pegar-faca, cortar(?i), guardar-faca

Vantagem hierárquica:

• Decisões de alto nível (simples vs. elaborado) primeiro

• Detalhes operacionais apenas quando necessário

• Captura conhecimento: "jantares simples usam saladas verdes"

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 28

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Algoritmos de Planejamento HTN

O algoritmo SHOP (Simple Hierarchical Ordered Planner) implementa busca em profundidade sobre espaço de decomposições, processando tarefas em ordem e cometendo-se a primeira decomposição aplicável encontrada. SHOP2 estende com backtracking inteligente quando decomposições levam a falhas, permitindo exploração sistemática de alternativas. A estratégia de busca totalmente ordenada simplifica implementação e reduz branching factor, mas pode perder oportunidades de paralelismo inerentes em ordenamentos parciais de subtarefas.

Planejadores HTN baseados em ordenamento parcial como UMCP exploram flexibilidade de entrelaçar subtarefas de diferentes decomposições, postergando decisões de ordenamento até forçadas por conflitos ou dependências causais. Esta abordagem gera planos mais concisos e eficientes quando paralelismo é possível, ao custo de maior complexidade algorítmica. A escolha entre ordenamento total e parcial envolve trade-off familiar entre eficiência de busca e qualidade de solução.

Algoritmos modernos como JSHOP2 e PyHipop integram capacidades de programação lógica, permitindo precondições complexas envolvendo consultas sobre estado atual, e raciocínio mais expressivo sobre decomposições apropriadas. Extensões para planejamento temporal hierárquico coordenam durações em diferentes níveis da hierarquia, enquanto variantes probabilísticas lidam com incerteza em efeitos de ações e disponibilidade de recursos. Estas generalizações mantêm poder estruturante da decomposição hierárquica enquanto endereçam complexidades de ambientes realísticos.

Exemplo: Execução de SHOP2

Problema: TransportarDoisPacotes(p1, p2, A, B)

Estado inicial: Em(p1,A), Em(p2,A), Em(t1,A)

Decomposição nível 1:

• TransportarDoisPacotes → TransportarPacote(p1) seguido de TransportarPacote(p2)

Decomposição nível 2 para TransportarPacote(p1):

• Método: UsarCaminhãoLocal (distância < 50km)

• Subtarefas: Carregar(t1,p1,A), Dirigir(t1,A,B), Descarregar(t1,p1,B)

Execução das ações primitivas:

1. Carregar(t1, p1, A)

Estado: Em(t1,A), Dentro(p1,t1), Em(p2,A)

2. Dirigir(t1, A, B)

Estado: Em(t1,B), Dentro(p1,t1), Em(p2,A)

3. Descarregar(t1, p1, B)

Estado: Em(t1,B), Em(p1,B), Em(p2,A)

Decomposição nível 2 para TransportarPacote(p2):

• Problema: p2 ainda em A, mas caminhão em B!

• SHOP2 detecta precondição violada

• Backtracking: tentar decomposição alternativa

• Solução: otimizar transportando ambos juntos

Plano otimizado:

1. Carregar(t1, p1, A)

2. Carregar(t1, p2, A)

3. Dirigir(t1, A, B)

4. Descarregar(t1, p1, B)

5. Descarregar(t1, p2, B)

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 29

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Dominância e Combinação de Heurísticas

Uma heurística h₁ domina h₂ se h₁(n) ≥ h₂(n) para todos os estados n, mantendo ambas admissíveis. A dominância implica que A* com h₁ nunca expande mais estados que com h₂, tornando h₁ estritamente superior para guiar busca. Esta relação de ordem parcial sobre heurísticas admissíveis permite classificação teórica de sua qualidade informativa, embora o custo computacional de avaliar heurísticas mais informativas possa ocasionalmente compensar reduções no número de expansões, criando trade-offs práticos não capturados pela dominância pura.

Quando múltiplas heurísticas admissíveis h₁, h₂, ..., hₖ estão disponíveis, tomar o máximo h(n) = max(h₁(n), h₂(n), ..., hₖ(n)) produz heurística admissível que domina cada componente individual. Esta combinação captura o melhor de múltiplas perspectivas sobre o problema, explorando sinergias onde diferentes heurísticas são mais informativas em diferentes regiões do espaço de estados. Implementações eficientes calculam heurísticas componentes sob demanda, interrompendo avaliação assim que valor suficientemente alto é obtido para decisão de expansão corrente.

Ensembles sofisticados alternam entre heurísticas durante busca baseado em características do estado atual ou histórico de desempenho, adaptando estratégia dinamicamente. Por exemplo, o planejador LAMA alterna entre busca com heurística de landmarks e busca com h^{FF}, explorando complementaridade entre guidance de curto prazo e identificação de estrutura global do problema. Esta meta-raciocínio sobre qual heurística empregar quando constitui área ativa de pesquisa que conecta planejamento clássico com aprendizado de máquina.

Exemplo: Combinação de Heurísticas

Três heurísticas para problema de roteamento:

h₁(n): distância Euclidiana até meta

• Rápida de calcular, sempre subestima

• Admissível: linha reta é caminho mais curto

h₂(n): distância de Manhattan (grid)

• Considera movimento restrito a eixos

• Mais informativa que h₁ em grades ortogonais

h₃(n): custo de caminho mais curto ignorando obstáculos

• Computacionalmente custosa (Dijkstra simplificado)

• Muito informativa, captura topologia

Heurística combinada:

• h(n) = max(h₁(n), h₂(n), h₃(n))

• Garante admissibilidade (máximo de admissíveis)

• Mais informativa que qualquer componente individual

Avaliação prática:

• Estado s₁: h₁=10, h₂=12, h₃=15 → h=15

• Estado s₂: h₁=8, h₂=8, h₃=20 → h=20

• Trade-off: tempo por nó vs. reduções em expansões

Estratégia adaptativa:

• Calcular h₁ e h₂ sempre (rápidas)

• Calcular h₃ apenas se max(h₁,h₂) não resolve decisão

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 19

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Heurísticas Inadmissíveis e Busca Ponderada

Embora heurísticas inadmissíveis sacrifiquem garantias de otimalidade, frequentemente proporcionam guidance mais agressivo que acelera descoberta de soluções satisfatórias quando otimalidade estrita não é crítica. Multiplicar heurística admissível por fator ω > 1 produz busca ponderada que expande estados com f(n) = g(n) + ω·h(n), explorando mais agressivamente direções promissoras ao custo de potencialmente retornar soluções subótimas limitadas por fator de ω. Esta técnica é especialmente valiosa em cenários onde encontrar qualquer solução rapidamente tem mais valor que garantir solução absolutamente ótima.

Algoritmos anytime como Anytime Repairing A* (ARA*) iniciam com peso alto (busca rápida mas potencialmente subótima) e progressivamente reduzem ω em iterações subsequentes, refinando solução até atingir optimalidade se tempo permitir. Esta abordagem fornece solução utilizável rapidamente enquanto melhora qualidade se computação adicional está disponível, adaptando-se flexivelmente a restrições computacionais variáveis. Limitações teóricas sobre suboptimalidade (solução retornada custará no máximo ω vezes o ótimo) fornecem garantias quantificáveis mesmo sem otimalidade estrita.

Domínios com características específicas motivam heurísticas especializadas que violam admissibilidade deliberadamente para capturar estruturas problemáticas particulares. Por exemplo, em planejamento temporal onde ações têm durações, heurísticas que contabilizam tempo crítico de caminho podem superestimar custos em cenários com alto paralelismo mas fornecem guidance superior em problemas fundamentalmente sequenciais. A escolha entre admissibilidade e informatividade pragmática depende criticamente dos requisitos aplicação-específicos sobre qualidade de solução versus tempo de resposta.

Análise: Impacto do Peso ω

Problema de navegação robótica (1000 estados)

A* padrão (ω = 1.0):

• Estados expandidos: 850

• Tempo: 5.2 segundos

• Custo solução: 42 (ótimo)

Busca ponderada (ω = 1.5):

• Estados expandidos: 320

• Tempo: 2.1 segundos (2.5× mais rápido)

• Custo solução: 48 (14% subótimo)

Busca ponderada (ω = 2.0):

• Estados expandidos: 180

• Tempo: 1.3 segundos (4× mais rápido)

• Custo solução: 53 (26% subótimo)

Busca ponderada (ω = 3.0):

• Estados expandidos: 95

• Tempo: 0.8 segundos (6.5× mais rápido)

• Custo solução: 61 (45% subótimo)

Análise do trade-off:

• ω = 1.5: bom equilíbrio prático

• ω = 2.0: aceitável se tempo crítico

• ω > 3.0: soluções podem ser muito ruins

Estratégia anytime:

• Iniciar com ω = 3.0 (solução rápida)

• Refinar com ω = 2.0, depois 1.5

• Finalizar com ω = 1.0 se tempo disponível

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 20

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Aprendizado Automático de Heurísticas

Técnicas de aprendizado de máquina podem automatizar construção de heurísticas através de treinamento em conjuntos de problemas resolvidos previamente, extraindo padrões que correlacionam características de estados com seus custos até objetivos. Abordagens supervisionadas treinam regressores (redes neurais, árvores de decisão, ou SVMs) usando pares ⟨estado, custo-real⟩ obtidos de soluções conhecidas, generalizando para estimar custos em estados não vistos durante treino. Esta automação de engenharia heurística promete escalabilidade para domínios novos onde expertise humana é limitada ou custosa de desenvolver.

O desafio central reside em projetar características (features) de estados que capturem informação relevante para predição de custos mantendo dimensionalidade tratável. Características proposicionais simples (quais fatos são verdadeiros) frequentemente são insuficientes, motivando engenharia de features que conta objetivos não-alcançados, detecta interações entre subobjetivos, ou mede distâncias em grafos de causalidade. Aprendizado de representações através de redes neurais profundas pode automatizar descoberta de features úteis, embora interpretabilidade e garantias teóricas sejam sacrificadas em comparação com heurísticas handcrafted com admissibilidade provável.

Aplicações recentes incluem synthesis de heurísticas para Rubik's Cube usando aprendizado por reforço que supera pattern databases clássicas, e meta-aprendizado que adapta heurísticas durante busca baseado em desempenho observado em estados já expandidos. Estes desenvolvimentos sugerem convergência futura entre planejamento simbólico clássico e técnicas modernas de aprendizado profundo, combinando garantias formais de métodos tradicionais com adaptabilidade e escalabilidade de abordagens data-driven.

Exemplo: Rede Neural para Heurística

Domínio: Sokoban (jogo de empurrar caixas)

Abordagem tradicional:

• Heurística handcrafted: distâncias mínimas caixas-alvos

• Limitação: não captura deadlocks (configurações insolúveis)

Abordagem com aprendizado:

Fase 1: Geração de dados

• Resolver 10.000 problemas Sokoban com A*

• Extrair pares ⟨estado, custo-real⟩ de soluções

• Total: ~1 milhão de exemplos de treinamento

Fase 2: Engenharia de features

• Posição de cada caixa (normalizada)

• Distâncias caixas-alvos mais próximos

• Padrões de bloqueio (canto, parede)

• Configuração local 3×3 ao redor de cada caixa

• Total: ~50 features por estado

Fase 3: Treinamento

• Rede neural: 50 → 128 → 64 → 1

• Função de perda: erro quadrático médio

• Regularização para evitar overfitting

Resultados:

• Correlação com h*: 0.89 (muito boa)

• Desempenho: 30% menos expansões que heurística manual

• Limitação: não garante admissibilidade

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 21

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Capítulo 5: STRIPS e Linguagens de Planejamento

O Formalismo STRIPS Clássico

STRIPS (Stanford Research Institute Problem Solver) estabeleceu paradigma duradouro para representação de problemas de planejamento através de especificação declarativa de ações como operadores com precondições e efeitos. Desenvolvido por Fikes e Nilsson em 1971, este formalismo modela estados como conjuntos de átomos ground (proposições instanciadas sem variáveis), ações como esquemas parametrizados, e mudanças através de listas explícitas de átomos adicionados e deletados. A simplicidade e expressividade deste modelo tornaram STRIPS fundamento conceitual sobre o qual planejadores modernos são construídos.

Um operador STRIPS especifica nome com parâmetros tipados, lista de precondições (conjunção de literais que devem ser verdadeiros para aplicabilidade), lista de adição (átomos que se tornam verdadeiros após execução), e lista de deleção (átomos que se tornam falsos). Por exemplo, o operador Move(r, x, y) para robô movendo-se de x para y teria precondição At(r,x) ∧ Adjacent(x,y), adicionaria At(r,y), e deletaria At(r,x). A suposição do mundo fechado para estados e hipótese do frame para ações simplificam raciocínio, assumindo que tudo não-mencionado é falso e tudo não-afetado permanece inalterado.

O processo de planejamento STRIPS original utilizava busca regressiva means-ends analysis, partindo de objetivos e identificando ações cujos efeitos satisfazem subobjetivos pendentes, recursivamente estabelecendo precondições destas ações como novos subobjetivos. Esta estratégia goal-directed reduz busca cega mas enfrenta dificuldades com interações entre subobjetivos onde alcançar um objetivo pode inadvertidamente destruir outro já estabelecido. Extensões modernas endereçam estas limitações através de técnicas como proteção de literais alcançados e ordenamento flexível de ações para minimizar conflitos destrutivos.

Exemplo Completo: Domínio de Transporte

Operador 1: Carregar(caminhão, pacote, local)

Precondições:

• At(caminhão, local)

• At(pacote, local)

Efeitos:

• ADD: In(pacote, caminhão)

• DEL: At(pacote, local)

Operador 2: Descarregar(caminhão, pacote, local)

Precondições:

• At(caminhão, local)

• In(pacote, caminhão)

Efeitos:

• ADD: At(pacote, local)

• DEL: In(pacote, caminhão)

Operador 3: Dirigir(caminhão, origem, destino)

Precondições:

• At(caminhão, origem)

• Conectado(origem, destino)

Efeitos:

• ADD: At(caminhão, destino)

• DEL: At(caminhão, origem)

Problema exemplo:

• Estado inicial: At(t1, CidadeA), At(p1, CidadeA)

• Meta: At(p1, CidadeB)

Plano solução:

1. Carregar(t1, p1, CidadeA)

2. Dirigir(t1, CidadeA, CidadeB)

3. Descarregar(t1, p1, CidadeB)

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 22

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

ADL e Extensões Expressivas

Action Description Language (ADL) estende STRIPS com construções lógicas mais ricas que aumentam poder expressivo mantendo tratabilidade computacional razoável. ADL permite precondições e efeitos condicionais arbitrários (não apenas conjunções), quantificação universal e existencial sobre objetos, igualdade e desigualdade entre termos, e tipos hierárquicos de objetos. Por exemplo, efeitos condicionais capturam situações onde consequência de ação depende de estado: limpar sala tem efeito Limpo(sala) apenas se ¬Trancado(sala), modelando naturalmente dependências contextuais.

Quantificadores em precondições expressam restrições sobre coleções de objetos: precondição ∀x (EmSala(x, s) → Evacuado(x)) garante que ação de lacrar sala s só é aplicável quando todos os ocupantes foram evacuados. Quantificadores em efeitos especificam mudanças universais: efeito ∀x (EmSala(x,s) → Contaminado(x)) modela que lacrar sala contaminada afeta todos os presentes. Esta expressividade permite modelagem compacta de domínios complexos que requereriam enumeração exaustiva em STRIPS básico.

A compilação de ADL para STRIPS através de grounding instancia todos os quantificadores e predicados para objetos específicos do problema, expandindo representação compacta em conjunto potencialmente exponencial de ações ground. Técnicas de grounding inteligente evitam instanciação de combinações irrelevantes através de análise de reachability que identifica quais instanciações podem aparecer em alguma execução possível. Esta pré-compilação transforma expressividade lógica em estrutura proposicional sobre a qual algoritmos de planejamento eficientes operam, mediando trade-off entre conveniência de modelagem e eficiência computacional.

Exemplo: Efeitos Condicionais em ADL

Ação: AbrirCaixa(robô, caixa, local)

Precondições:

• At(robô, local)

• At(caixa, local)

• ¬Aberta(caixa)

Efeitos:

• Aberta(caixa) [incondicional]

• QUANDO Conteúdo(caixa, tesouro):

→ Tem(robô, tesouro) ∧ ¬Conteúdo(caixa, tesouro)

• QUANDO Conteúdo(caixa, armadilha):

→ Ativada(armadilha) ∧ Danificado(robô)

• QUANDO ¬∃x (Conteúdo(caixa, x)):

→ Vazia(caixa)

Interpretação:

• Efeito da ação depende do conteúdo (desconhecido a priori)

• Modelagem natural de incerteza sobre estado do mundo

• STRIPS precisaria de ações separadas para cada possibilidade

Compilação para STRIPS:

• Gerar três ações ground para cada instância:

- AbrirCaixaComTesouro(r, c, l)

- AbrirCaixaComArmadilha(r, c, l)

- AbrirCaixaVazia(r, c, l)

• Trade-off: expressividade vs. explosão combinatória

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 23

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Fluentes Numéricos e PDDL Avançado

PDDL 2.1 introduziu fluentes numéricos que associam valores reais a aspectos do estado, permitindo modelagem de recursos consumíveis, durações temporais, e métricas contínuas. Um fluente como (combustível ?veículo) retorna valor numérico representando quantidade atual, e ações podem especificar efeitos como (decrease (combustível v1) 10) que modificam estes valores aritmeticamente. Esta extensão amplia dramaticamente aplicabilidade do planejamento para domínios práticos onde quantidades e otimização numérica são essenciais, como logística com restrições de capacidade, agendamento com durações variáveis, e controle de processos industriais.

Precondições sobre fluentes usam comparadores para testar valores: (>= (combustível ?v) 50) requer que veículo tenha pelo menos 50 unidades. Efeitos incluem operações aritméticas arbitrárias: (increase (distância-percorrida ?v) (* (velocidade ?v) (duração ?ação))). Funções de otimização especificam métricas a minimizar ou maximizar, como (:metric minimize (total-cost)) ou (:metric maximize (lucro-total)), transformando planejamento de busca qualitativa (alcançar objetivos) em otimização quantitativa (alcançar objetivos otimizando métricas específicas).

O tratamento de fluentes numéricos introduz complexidades computacionais adicionais pois o espaço de estados torna-se potencialmente infinito e comparações numéricas podem ser indecidíveis em casos gerais. Planejadores práticos restringem expressividade a fragmentos tratáveis, como atualizações lineares de fluentes e precondições com comparações simples, mantendo decidibilidade enquanto capturam a maioria das necessidades de modelagem práticas. Algoritmos como metric-FF estendem técnicas de delete-relaxation para contextos numéricos, computando relaxações onde recursos são ilimitados para derivar heurísticas admissíveis.

Exemplo: Planejamento com Fluentes

Domínio: Entrega com restrição de combustível

Fluentes:

• (combustível ?caminhão): quantidade atual

• (distância ?origem ?destino): distância entre locais

• (carga ?caminhão): peso atual carregado

Ação: Dirigir(?c, ?origem, ?destino)

Precondições:

• (at ?c ?origem)

• (>= (combustível ?c)

(* (distância ?origem ?destino) (consumo-base)))

Efeitos:

• (not (at ?c ?origem))

• (at ?c ?destino)

• (decrease (combustível ?c)

(* (distância ?origem ?destino)

(+ (consumo-base)

(* 0.1 (carga ?c)))))

Ação: Abastecer(?c, ?posto)

Precondições:

• (at ?c ?posto)

• (é-posto ?posto)

Efeitos:

• (assign (combustível ?c) (capacidade-tanque ?c))

Métrica:

• (:metric minimize (+ (total-distância) (* 10 (total-abastecimentos))))

Análise:

• Planejador deve balancear distância vs. paradas para abastecer

• Carga afeta consumo: otimização conjunta de rota e carga

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 24

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Planejamento Temporal e Ações Durativas

PDDL 2.1 introduziu ações durativas que ocupam intervalos temporais ao invés de serem instantâneas, modelando realismo de atividades que consomem tempo como cozinhar, transportar, ou processar materiais. Uma ação durativa especifica condições e efeitos em três timepoints: start (início da execução), over all (durante toda execução), e end (término). Por exemplo, assar bolo requer forno disponível no start, forno ocupado over all, e produz bolo pronto no end. Esta granularidade temporal permite paralelismo controlado onde múltiplas ações executam concorrentemente respeitando dependências e restrições de recursos.

A duração pode ser fixa, variável limitada por inequações, ou dependente de fluentes através de expressões aritméticas. Precondições over all devem permanecer verdadeiras durante toda execução, impedindo interferências destrutivas. Efeitos continuous change modelam mudanças graduais como (increase (temperatura forno) (* #t 50)) onde #t é variável representando tempo decorrido. Estes mecanismos capturam física de processos contínuos impossível de expressar em modelos puramente discretos, aproximando planejamento de controle de sistemas híbridos.

Algoritmos de planejamento temporal como POPF e TempLM estendem técnicas de busca heurística para espaços de estados temporalmente estendidos, mantendo line temporal de ações sobrepostas e verificando consistência de restrições temporais e de recursos. A complexidade aumenta significativamente pois ordenamentos parciais entre ações oferecem flexibilidade que deve ser explorada para encontrar planos válidos, mas também expande dramáticamente o espaço de busca. Técnicas de decomposição temporal e análise de profiles de recursos reduzem complexidade identificando gargalos críticos que constrangem soluções viáveis.

Exemplo: Ação Durativa

Ação: Transportar(?robô, ?objeto, ?origem, ?destino)

Duração:

• (= ?duration (/ (distância ?origem ?destino) (velocidade ?robô)))

Condições START:

• (at ?robô ?origem)

• (at ?objeto ?origem)

• (livre ?robô)

Condições OVER ALL:

• (carregando ?robô ?objeto)

• (>= (bateria ?robô) 10)

Efeitos START:

• (not (at ?objeto ?origem))

• (not (livre ?robô))

• (carregando ?robô ?objeto)

Efeitos CONTINUOUS:

• (decrease (bateria ?robô) (* #t (consumo-energia ?robô)))

Efeitos END:

• (at ?robô ?destino)

• (at ?objeto ?destino)

• (livre ?robô)

• (not (carregando ?robô ?objeto))

Plano temporal exemplo:

• 0.0: START Transportar(r1, caixa1, A, B) [duração: 5.0]

• 2.0: START Transportar(r2, caixa2, C, B) [duração: 3.0]

• 5.0: END Transportar(r1, caixa1, A, B)

• 5.0: END Transportar(r2, caixa2, C, B)

• Paralelismo: r1 e r2 operam simultaneamente

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 25

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Grounding e Compilação de Problemas

O processo de grounding transforma especificação compacta de domínio em linguagem de primeira ordem (com variáveis e quantificadores) em representação proposicional explícita onde todas as variáveis são substituídas por objetos concretos do problema. Para domínio com k esquemas de ações e n objetos, grounding ingênuo pode gerar até k·n^m ações ground onde m é aridade máxima, crescimento que rapidamente torna-se impraticável. Por exemplo, ação Move(?robô, ?origem, ?destino) com 100 localizações e 5 robôs produz 5·100·99 = 49.500 ações ground.

Técnicas de grounding inteligente exploram análise de reachability para identificar e descartar instanciações que nunca podem aparecer em nenhuma execução válida. Análise de tipos estáticos elimina combinações incompatíveis (não tentar mover objetos do tipo Caminhão como se fossem Pacotes), enquanto análise de reachability dinâmica propaga fatos alcançáveis iterativamente, instanciando apenas ações cujas precondições podem ser satisfeitas por estados alcançáveis. Estas técnicas reduzem frequentemente o tamanho do problema ground em várias ordens de magnitude sem perder soluções.

Compilações transformam extensões expressivas como precondições negativas, efeitos condicionais, ou objetivos complexos em fragmentos mais restritos sobre os quais planejadores eficientes operam. Por exemplo, precondições negativas ¬P podem ser substituídas por novas variáveis proposicionais Not-P explicitamente mantidas consistentes através de efeitos de ações. Estas transformações preservam semântica enquanto expõem estrutura que algoritmos especializados exploram eficientemente, ilustrando princípio geral de reduzir problemas complexos a núcleos computacionalmente tratáveis através de pré-processamento inteligente.

Análise: Explosão vs. Redução de Grounding

Domínio de Logística

Esquemas de ações: 4 (Carregar, Descarregar, Dirigir, Voar)

Objetos:

• 10 cidades, 20 locais por cidade (200 locais totais)

• 50 pacotes, 15 caminhões, 3 aviões

Grounding ingênuo:

• Carregar(?c, ?p, ?l): 15·50·200 = 150.000 instâncias

• Dirigir(?c, ?de, ?para): 15·200·200 = 600.000

• Total bruto: > 1 milhão de ações ground

Análise de tipos:

• Caminhões só dirigem dentro da mesma cidade

• Reduz Dirigir para: 15·20·20 = 6.000 (100× redução)

Análise de reachability:

• Pacotes inicialmente em poucas localizações

• Carregar só relevante onde pacotes podem estar

• Reduz Carregar para ~5.000 instâncias

Resultado final:

• ~20.000 ações ground (50× redução total)

• Tempo de grounding: 0.3s vs. memória insuficiente

Impacto no planejamento:

• Problema agora cabe em memória

• Busca heurística viável (antes impossível)

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 26

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Validação e Verificação de Planos

A validação de planos verifica se sequência proposta de ações efetivamente transforma estado inicial em estado que satisfaz objetivos, detectando erros como precondições violadas, ordenamentos temporais inválidos, ou conflitos de recursos. Validadores automatizados executam plano simbolicamente passo-a-passo, mantendo estado corrente e verificando aplicabilidade de cada ação antes de aplicar seus efeitos. Esta verificação independente proporciona confiança adicional em corretude de planejadores, particularmente importante para sistemas safety-critical onde falhas têm consequências graves.

VAL (Validator) constitui ferramenta padrão desenvolvida para competições de planejamento, suportando toda expressividade de PDDL incluindo temporalidade, fluentes numéricos, e efeitos condicionais. Além de validação básica, VAL analisa propriedades como robustez do plano (sensibilidade a pequenas variações em durações ou valores numéricos), detecta potenciais deadlocks em planos concorrentes, e verifica satisfação de invariantes de domínio. Estas análises adicionais identificam fragilidades que poderiam causar falhas durante execução real mesmo quando plano é tecnicamente válido segundo especificação formal.

Verificação formal vai além de validação, provando propriedades mais fortes como corretude independente de estado inicial específico, ausência de deadlocks em todas as execuções possíveis, ou garantia de propriedades temporais como "robô eventualmente retorna à base". Model checking e theorem proving automatizados aplicam-se a verificação de planejadores e planos, complementando testes empíricos com garantias formais. Esta interseção entre planejamento e métodos formais é especialmente relevante para certificação de sistemas autônomos em domínios regulamentados como aeronáutica e medicina.

Exemplo: Validação Detectando Erro

Plano proposto (incorreto):

1. Carregar(t1, p1, CidadeA)

2. Descarregar(t1, p1, CidadeB)

3. Dirigir(t1, CidadeA, CidadeB)

Validação passo-a-passo:

Estado inicial:

• At(t1, CidadeA), At(p1, CidadeA)

Após ação 1:

• At(t1, CidadeA), In(p1, t1) ✓ válido

Tentativa ação 2:

• Precondição: At(t1, CidadeB)

• Estado atual: At(t1, CidadeA)

• ERRO: Precondição violada! ✗

Diagnóstico:

• Ação 2 requer caminhão em CidadeB

• Mas ação 3 (movimento) vem depois

• Ordenamento incorreto das ações

Plano corrigido:

1. Carregar(t1, p1, CidadeA)

2. Dirigir(t1, CidadeA, CidadeB)

3. Descarregar(t1, p1, CidadeB)

Validação do plano corrigido:

• Todas as precondições satisfeitas ✓

• Estado final alcança meta: At(p1, CidadeB) ✓

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 27

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Capítulo 6: Planejamento Hierárquico

Motivação e Fundamentos HTN

Hierarchical Task Network (HTN) planning aborda complexidade do planejamento através de decomposição hierárquica de tarefas complexas em redes de subtarefas progressivamente mais simples até alcançar ações primitivas executáveis. Esta abordagem reflete naturalmente como humanos raciocinam sobre problemas complexos: para viajar de A a B, primeiro decidimos transporte (avião, carro, trem), depois refinamos cada escolha em passos detalhados (comprar passagem, fazer check-in, embarcar). A estrutura hierárquica captura conhecimento sobre estratégias bem-sucedidas, guiando busca mais eficientemente que planejamento puramente ground-level.

Um problema HTN especifica tarefas compostas (não-primitivas) decomponíveis em subtarefas através de métodos que especificam decomposições alternativas, e tarefas primitivas correspondendo a ações do mundo. Métodos incluem precondições determinando quando decomposição é aplicável, e rede de subtarefas com ordenamentos parciais e vínculos entre variáveis. Por exemplo, tarefa composta TransportarPacote tem método usando CaminhãoLocal para destinos próximos e método usando AviãoDistante para destinos remotos, cada qual decompondo-se em sequências específicas de ações primitivas.

A busca HTN explora recursivamente decomposições possíveis, mantendo lista de tarefas pendentes e progressivamente refinando tarefas compostas até obter plano consistindo apenas de ações primitivas. Ordenamentos parciais entre tarefas proporcionam flexibilidade, permitindo entrelaçamento eficiente de subplanos para diferentes objetivos. Esta estrutura naturalmente captura expertise de domínio sobre "melhores práticas", tornando HTN especialmente adequado para domínios onde estratégias eficazes são conhecidas mas espaço de busca para descobri-las automaticamente é proibitivo.

Exemplo: Rede Hierárquica de Tarefas

Tarefa de alto nível: PrepararJantar

Método 1: JantarSimples

Decomposição:

1. FazerSalada

2. CozinharMassaMolho

3. ColocarMesa

Método 2: JantarElaborado

Precondição: TempoDisponível > 90min

Decomposição:

1. PrepararEntrada

2. CozinharPratoPrincipal

3. FazerSobremesa

4. ColocarMesa

Refinamento de FazerSalada:

Método 1: SaladaVerde

• Subtarefas: LavarVegetais, CortarIngredientes, TempararSalada

Método 2: SaladaMista

• Subtarefas: LavarVegetais, CozinharOvos, CortarTudo, Misturar

Ações primitivas:

• LavarVegetais(?v): pegar(?v), lavar-em-pia(?v), secar(?v)

• CortarIngredientes(?i): pegar-faca, cortar(?i), guardar-faca

Vantagem hierárquica:

• Decisões de alto nível (simples vs. elaborado) primeiro

• Detalhes operacionais apenas quando necessário

• Captura conhecimento: "jantares simples usam saladas verdes"

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 28

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Algoritmos de Planejamento HTN

O algoritmo SHOP (Simple Hierarchical Ordered Planner) implementa busca em profundidade sobre espaço de decomposições, processando tarefas em ordem e cometendo-se a primeira decomposição aplicável encontrada. SHOP2 estende com backtracking inteligente quando decomposições levam a falhas, permitindo exploração sistemática de alternativas. A estratégia de busca totalmente ordenada simplifica implementação e reduz branching factor, mas pode perder oportunidades de paralelismo inerentes em ordenamentos parciais de subtarefas.

Planejadores HTN baseados em ordenamento parcial como UMCP exploram flexibilidade de entrelaçar subtarefas de diferentes decomposições, postergando decisões de ordenamento até forçadas por conflitos ou dependências causais. Esta abordagem gera planos mais concisos e eficientes quando paralelismo é possível, ao custo de maior complexidade algorítmica. A escolha entre ordenamento total e parcial envolve trade-off familiar entre eficiência de busca e qualidade de solução.

Algoritmos modernos como JSHOP2 e PyHipop integram capacidades de programação lógica, permitindo precondições complexas envolvendo consultas sobre estado atual, e raciocínio mais expressivo sobre decomposições apropriadas. Extensões para planejamento temporal hierárquico coordenam durações em diferentes níveis da hierarquia, enquanto variantes probabilísticas lidam com incerteza em efeitos de ações e disponibilidade de recursos. Estas generalizações mantêm poder estruturante da decomposição hierárquica enquanto endereçam complexidades de ambientes realísticos.

Exemplo: Execução de SHOP2

Problema: TransportarDoisPacotes(p1, p2, A, B)

Estado inicial: Em(p1,A), Em(p2,A), Em(t1,A)

Decomposição nível 1:

• TransportarDoisPacotes → TransportarPacote(p1) seguido de TransportarPacote(p2)

Decomposição nível 2 para TransportarPacote(p1):

• Método: UsarCaminhãoLocal (distância < 50km)

• Subtarefas: Carregar(t1,p1,A), Dirigir(t1,A,B), Descarregar(t1,p1,B)

Execução das ações primitivas:

1. Carregar(t1, p1, A)

Estado: Em(t1,A), Dentro(p1,t1), Em(p2,A)

2. Dirigir(t1, A, B)

Estado: Em(t1,B), Dentro(p1,t1), Em(p2,A)

3. Descarregar(t1, p1, B)

Estado: Em(t1,B), Em(p1,B), Em(p2,A)

Decomposição nível 2 para TransportarPacote(p2):

• Problema: p2 ainda em A, mas caminhão em B!

• SHOP2 detecta precondição violada

• Backtracking: tentar decomposição alternativa

• Solução: otimizar transportando ambos juntos

Plano otimizado:

1. Carregar(t1, p1, A)

2. Carregar(t1, p2, A)

3. Dirigir(t1, A, B)

4. Descarregar(t1, p1, B)

5. Descarregar(t1, p2, B)

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 29

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

HTN versus Planejamento Clássico

A comparação entre planejamento HTN e planejamento clássico revela trade-offs fundamentais entre expressividade, eficiência e modelagem de conhecimento. HTN é mais expressivo que STRIPS clássico, podendo representar problemas indecidíveis quando métodos incluem recursão arbitrária ou decomposições infinitas. Esta expressividade adicional permite capturar procedimentos complexos e estratégias domain-specific que guiam busca eficientemente, mas sacrifica garantias de completude computacional presentes em planejamento proposicional decidível.

Empiricamente, HTN frequentemente supera planejadores clássicos em domínios onde boas estratégias são conhecidas e podem ser codificadas como métodos de decomposição. A hierarquia reduz branching factor considerado em cada ponto de decisão, focando busca em refinamentos de estratégias promissoras ao invés de explorar todas as combinações possíveis de ações primitivas. Esta guidance domain-specific é particularmente valiosa em planejamento para robótica e jogos onde espaços de estados são enormes mas estruturas repetitivas permitem abstrações eficazes.

Contrapartida é que HTN requer mais esforço de modelagem para especificar métodos de decomposição apropriados, transferindo parte da complexidade de tempo de execução para tempo de desenvolvimento. Planejadores clássicos domain-independent descobrem soluções automaticamente dada apenas especificação de ações e objetivos, sem requerer expertise sobre estratégias eficazes. Abordagens híbridas combinam ambos paradigmas: usar HTN para estruturação de alto nível e planejamento clássico para preenchimento de detalhes, explorando forças complementares de cada técnica.

Comparação Empírica

Domínio: Construção de estruturas (blocos)

Problema: Construir torre de 10 blocos

Planejador Clássico (FF):

• Espaço de busca: ~10¹⁰ estados possíveis

• Estados expandidos: 127.000

• Tempo: 8.3 segundos

• Comprimento do plano: 19 ações

Planejador HTN (SHOP2):

• Método: ConstruirTorre decompõe recursivamente

• Estados (decomposições) explorados: 45

• Tempo: 0.2 segundos (41× mais rápido)

• Comprimento do plano: 19 ações (mesmo ótimo)

Análise:

• HTN explora dramaticamente menos alternativas

• Estratégia "construir de baixo para cima" codificada

• Planejador clássico descobre mesma estratégia

Trade-off:

• HTN: rápido mas requer modelagem cuidadosa

• Clássico: mais lento mas totalmente automático

Quando HTN falha:

• Problema: construir estrutura irregular não-padrão

• Métodos HTN codificados não aplicam

• Planejador clássico encontra solução criativa

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 30

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Aplicações de Planejamento Hierárquico

Planejamento HTN encontra aplicações extensivas em domínios onde estrutura hierárquica natural reflete organização do conhecimento ou procedimentos operacionais. Em planejamento militar, operações táticas decompõem-se em manobras de unidades que por sua vez refinam-se em movimentos individuais, capturando naturalmente doutrina e estratégias estabelecidas. Sistemas como O-Plan e SIPE-2 foram desenvolvidos especificamente para planejamento de missões complexas, integrando HTN com raciocínio temporal e alocação de recursos.

Na robótica, comportamentos de alto nível como "explorar ambiente" decompõem-se em padrões de navegação ("cobrir grade sistematicamente") que refinam-se em comandos de movimento primitivos. Esta hierarquia permite reação adaptativa onde falhas em níveis baixos podem ser tratadas através de decomposições alternativas em níveis superiores, sem replanejar completamente desde o início. A modularidade hierárquica também facilita depuração e manutenção de sistemas complexos, isolando funcionalidades em diferentes níveis de abstração.

Jogos digitais utilizam HTN extensivamente para comportamento de NPCs (personagens não-jogadores), onde objetivos táticos como "derrotar inimigo" decompõem-se em sequências de ações específicas do contexto. A expressividade de HTN permite codificar personalidades distintas através de bibliotecas diferentes de métodos de decomposição, criando adversários com estilos de jogo variados sem requerer inteligência artificial completamente diferente. Esta aplicação demonstra valor de HTN para domínios onde performance em tempo real e previsibilidade comportamental são prioritárias sobre optimalidade estrita.

Aplicação: IA em Jogos de Estratégia

Cenário: Jogo de estratégia em tempo real (RTS)

Objetivo de alto nível: DerrotarOponente

Método 1: EstratégiaAgressiva

Precondições: RecursosIniciais > 1000

Decomposição:

1. ConstruirBarracas

2. TreinarExércitoGrande

3. AtacarBaseInimiga

Método 2: EstratégiaDefensiva

Precondições: RecursosIniciais < 500

Decomposição:

1. FortificarBase

2. ColetarRecursos

3. ConstruirDefesas

4. ContraAtacarQuandoForte

Refinamento de TreinarExércitoGrande:

• Método ComposiçãoBalanceada:

- TreinarSoldados(quantidade: 20)

- TreinarArqueiros(quantidade: 15)

- TreinarCavalaria(quantidade: 5)

Ações primitivas:

• TreinarSoldado(?quartel): consome 50 recursos, 30s

• ConstruirTorre(?local): consome 200 recursos, 60s

Vantagens para jogos:

• Comportamento previsível e compreensível

• Fácil ajustar dificuldade (mudar métodos)

• Performance: decisões hierárquicas são rápidas

• Modular: adicionar novas estratégias facilmente

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 31

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Síntese Automática de Métodos HTN

A síntese automática de métodos HTN busca aliviar o esforço de modelagem manual através de técnicas que aprendem decomposições eficazes a partir de exemplos ou experiência. Abordagens baseadas em aprendizado por reforço observam execuções bem-sucedidas e extraem padrões recorrentes de sequências de ações, abstraindo-os em métodos reutilizáveis. Por exemplo, observar repetidamente sequência "pegar-ferramenta, usar-ferramenta, guardar-ferramenta" pode induzir método genérico UsarFerramenta(?f) que encapsula este padrão.

Técnicas de indução de gramáticas analisam planos gerados por planejadores clássicos e identificam estruturas hierárquicas latentes através de algoritmos de compressão ou clustering de subsequências similares. Uma vez identificados padrões frequentes, eles são promovidos a métodos que guiam planejamento futuro, acelerando resolução de problemas similares. Este ciclo de aprendizado contínuo permite sistemas que melhoram progressivamente desempenho através de experiência acumulada.

Desafios incluem determinar nível apropriado de abstração para métodos sintetizados (muito específicos perdem generalidade, muito gerais oferecem pouca guidance), validar corretude de métodos aprendidos (garantir que decomposições sempre levam a estados válidos), e balancear exploração de novas estratégias versus exploração de métodos já aprendidos. Pesquisas recentes exploram meta-aprendizado onde sistemas aprendem como aprender métodos eficazes, adaptando estratégias de síntese ao domínio específico automaticamente.

Exemplo: Aprendizado de Métodos

Observações de execuções bem-sucedidas:

Execução 1 (transportar livro):

1. NavegaParaOrigem(biblioteca)

2. PegarObjeto(livro1)

3. NavegaParaDestino(escritório)

4. SoltarObjeto(livro1)

Execução 2 (transportar laptop):

1. NavegaParaOrigem(sala-reunião)

2. PegarObjeto(laptop1)

3. NavegaParaDestino(meu-escritório)

4. SoltarObjeto(laptop1)

Execução 3 (transportar copo):

1. NavegaParaOrigem(cozinha)

2. PegarObjeto(copo3)

3. NavegaParaDestino(sala-estar)

4. SoltarObjeto(copo3)

Padrão identificado:

• Sequência comum: Navega-origem, Pegar, Navega-destino, Soltar

• Variação: objetos e localizações específicos

Método sintetizado:

Nome: TransportarObjeto(?obj, ?de, ?para)

Precondições: Em(?obj, ?de)

Decomposição:

1. NavegaParaOrigem(?de)

2. PegarObjeto(?obj)

3. NavegaParaDestino(?para)

4. SoltarObjeto(?obj)

Resultado: Método reutilizável para futuras tarefas de transporte

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 32

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Limitações e Desafios do HTN

Apesar de suas vantagens, planejamento HTN enfrenta limitações significativas que restringem sua aplicabilidade em certos contextos. A dependência de métodos pré-especificados significa que HTN pode falhar completamente em problemas que requerem soluções criativas não-antecipadas pelos modeladores, enquanto planejadores clássicos domain-independent podem descobrir soluções inovadoras explorando combinações arbitrárias de ações. Esta rigidez é especialmente problemática em ambientes dinâmicos onde novas situações emergem frequentemente.

A verificação de completude em HTN é mais complexa que em planejamento clássico: mesmo quando problema tem solução, conjunto incompleto de métodos pode não conseguir encontrá-la. Determinar se biblioteca de métodos é suficiente para cobrir todos os problemas de interesse é geralmente indecidível, requerendo análise cuidadosa ou testes extensivos. Manutenção de grandes bibliotecas de métodos também apresenta desafios de engenharia de software, com riscos de inconsistências entre métodos ou decomposições que interagem de formas não-previstas.

Adaptação de métodos existentes para variações de domínio requer frequentemente reengenharia significativa, limitando reusabilidade cross-domain que é força de planejadores domain-independent. Extensões para planejamento probabilístico ou contínuo são mais complexas em HTN que em frameworks clássicos, pois incerteza deve propagar através de múltiplos níveis hierárquicos e decomposições alternativas devem considerar probabilidades de sucesso. Estas limitações motivam pesquisas em abordagens híbridas que combinam estruturação hierárquica com flexibilidade de busca domain-independent.

Exemplo: Falha por Métodos Incompletos

Problema: Robô precisa atravessar sala com obstáculo

Biblioteca de métodos disponíveis:

Método 1: IrDiretoAoDestino

Precondição: CaminhoLivre(origem, destino)

Decomposição: NavegaçãoDireta(origem, destino)

Método 2: ContornarObstáculoEsquerda

Precondição: ObstáculoCentral ∧ EspaçoEsquerda

Decomposição: Desviar-esquerda, Contornar, Retornar-rota

Situação problema:

• Obstáculo central: ✓

• Espaço à esquerda: ✗ (bloqueado)

• Espaço à direita: ✓ (livre)

Resultado:

• Método 1: falha (caminho não livre)

• Método 2: falha (precondição EspaçoEsquerda não satisfeita)

• HTN não encontra solução!

Solução óbvia (que HTN não vê):

• Contornar pela direita (método não codificado)

Como planejador clássico resolve:

• Descobre automaticamente: mover-direita, avançar, mover-esquerda

• Não depende de métodos pré-especificados

Lição: HTN requer biblioteca completa de métodos

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 33

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Capítulo 7: Grafos de Planejamento e GraphPlan

Estrutura de Grafos de Planejamento

O algoritmo GraphPlan, desenvolvido por Avrim Blum e Merrick Furst em 1997, introduziu estrutura de dados revolucionária que representa compactamente múltiplos planos possíveis simultaneamente através de grafo de planejamento em camadas. Este grafo alterna entre níveis de proposições (representando possíveis estados) e níveis de ações (representando ações aplicáveis), construindo-se incrementalmente desde o estado inicial. Cada nível captura não apenas o que é possível alcançar, mas também relações de exclusão mútua (mutex) entre proposições e ações que não podem coexistir.

Um grafo de planejamento para horizonte temporal t consiste de 2t+1 níveis: níveis P₀, A₀, P₁, A₁, ..., Pₜ onde P₀ contém proposições verdadeiras no estado inicial, Aᵢ contém ações aplicáveis no nível i, e Pᵢ₊₁ contém proposições potencialmente verdadeiras após executar ações em Aᵢ. Arestas conectam ações às suas precondições e efeitos, criando estrutura que captura dependências causais de forma explícita. Relações mutex entre pares de nós no mesmo nível codificam incompatibilidades: duas ações são mutex se uma deleta precondição da outra, enquanto duas proposições são mutex se todas as formas de alcançá-las envolvem ações mutex.

A construção do grafo prossegue até que todas as proposições meta apareçam em algum nível Pₜ sem mutexes entre elas, estabelecendo condição necessária (mas não suficiente) para existência de plano. Esta fase de expansão do grafo é polinomial no tamanho do problema, proporcionando bound inferior rápido no comprimento de planos possíveis. Subsequentemente, busca backward extrai plano concreto do grafo através de seleção cuidadosa de ações que estabelecem metas sem violar restrições mutex.

Exemplo: Construção de Grafo

Problema simples: Acender duas lâmpadas

Estado inicial P₀: Apagada(L1), Apagada(L2)

Ações disponíveis: Acender(L1), Acender(L2)

Meta: Acesa(L1) ∧ Acesa(L2)

Nível A₀ (ações aplicáveis):

• Acender(L1): precond={Apagada(L1)}, efeitos={Acesa(L1), ¬Apagada(L1)}

• Acender(L2): precond={Apagada(L2)}, efeitos={Acesa(L2), ¬Apagada(L2)}

• Ações persistência: manter Apagada(L1), manter Apagada(L2)

Mutexes em A₀:

• Acender(L1) e manter Apagada(L1): efeitos inconsistentes

• Acender(L2) e manter Apagada(L2): efeitos inconsistentes

• Acender(L1) e Acender(L2): NÃO mutex (independentes)

Nível P₁ (proposições alcançáveis):

• Acesa(L1), Acesa(L2), Apagada(L1), Apagada(L2)

Mutexes em P₁:

• Acesa(L1) e Apagada(L1): contraditórias

• Acesa(L2) e Apagada(L2): contraditórias

• Acesa(L1) e Acesa(L2): NÃO mutex!

Verificação da meta:

• Acesa(L1) ∈ P₁? Sim ✓

• Acesa(L2) ∈ P₁? Sim ✓

• São mutex? Não ✓

• Conclusão: plano pode existir em 1 passo

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 34

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Análise de Relações Mutex

As relações mutex constituem inovação central do GraphPlan, capturando incompatibilidades que podam drasticamente espaço de busca. Duas ações a₁ e a₂ em nível Aᵢ são mutex se: (1) efeitos inconsistentes - uma deleta efeito da outra, (2) interferência - uma deleta precondição da outra, ou (3) precondições competitivas - suas precondições contêm par de proposições mutex em Pᵢ. Estas condições propagam-se através de níveis, refinando análise de compatibilidade progressivamente.

Duas proposições p e q em nível Pᵢ são mutex se todas as formas de torná-las verdadeiras envolvem pares de ações mutex - formalmente, para todo par de ações ⟨a₁,a₂⟩ onde a₁ adiciona p e a₂ adiciona q, tem-se que a₁ e a₂ são mutex. Esta definição recursiva permite computação eficiente: mutexes entre proposições determinam-se a partir de mutexes entre ações no nível anterior, que por sua vez dependem de mutexes proposicionais ainda anteriores, iniciando com conjunto vazio em P₀.

A análise mutex converge quando um nível é alcançado sem novas mutexes além das presentes no nível anterior - neste ponto, estrutura estabilizou-se e níveis subsequentes serão isomórficos ao último. Este fenômeno de leveloff ocorre em tempo polinomial, garantindo que construção do grafo termina eficientemente. As relações mutex preservadas após leveloff representam incompatibilidades fundamentais do domínio independentes de horizonte temporal, proporcionando insights sobre estrutura intrínseca do problema de planejamento.

Exemplo: Propagação de Mutex

Domínio: Robô com uma mão

Estado inicial: EmMesa(A), EmMesa(B), MãoVazia

Ações:

• Pegar(A): precond={EmMesa(A), MãoVazia}, efeitos={Segurando(A), ¬MãoVazia}

• Pegar(B): precond={EmMesa(B), MãoVazia}, efeitos={Segurando(B), ¬MãoVazia}

Análise de mutex em A₀:

Pegar(A) vs. Pegar(B):

• Precondições competitivas? Compartilham MãoVazia

• Após Pegar(A): ¬MãoVazia (deleta precond de Pegar(B))

• Após Pegar(B): ¬MãoVazia (deleta precond de Pegar(A))

• Conclusão: Pegar(A) e Pegar(B) são MUTEX

Implicações em P₁:

• Segurando(A) só alcançável via Pegar(A)

• Segurando(B) só alcançável via Pegar(B)

• Como Pegar(A) e Pegar(B) são mutex:

→ Segurando(A) e Segurando(B) são MUTEX em P₁

Interpretação física:

• Impossível segurar dois objetos com uma mão

• Mutex captura restrição física fundamental

• Persiste em todos os níveis (incompatibilidade permanente)

Impacto na busca:

• Planejador nunca tentará alcançar ambos simultaneamente

• Reduz dramaticamente ramificação da busca

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 35

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Extração de Planos do Grafo

Uma vez construído grafo onde metas aparecem sem mutexes, fase de extração busca backward através dos níveis selecionando ações que estabelecem objetivos progressivamente. Iniciando no nível Pₜ, algoritmo seleciona conjunto de ações em Aₜ₋₁ que adiciona todas as proposições meta sem violar restrições mutex. Estas ações por sua vez têm precondições que tornam-se novos subobjetivos em Pₜ₋₁, e processo recursivo continua até P₀. Backtracking ocorre quando nenhuma seleção válida de ações existe, explorando alternativas sistematicamente.

Heurísticas para extração incluem ordenamento de objetivos priorizando aqueles com menos escolhas de ações produtoras (mais constritivos primeiro), e memoização de conjuntos de objetivos impossíveis de alcançar conjuntamente (nogoods) para evitar reexploração de combinações fúteis. Técnicas de constraint satisfaction propagam restrições entre escolhas de ações em diferentes níveis, detectando inconsistências precocemente e podando ramos infrutíferos da busca antes de exploração completa.

A complexidade da extração é NP-completa no pior caso, mas poda proporcionada por mutexes e análise de dependências frequentemente torna busca tratável na prática. Em problemas onde construção do grafo já é dominante computacionalmente, extração adiciona overhead relativamente pequeno. Para problemas difíceis onde múltiplas tentativas de extração falham, GraphPlan pode expandir grafo para mais níveis antes de reintentar, balanceando custo de expansão versus dificuldade de extração.

Exemplo: Extração Passo-a-Passo

Grafo construído até nível P₂

Meta em P₂: EmB(A), EmB(C)

Passo 1: Selecionar ações em A₁

• Para EmB(A): ações disponíveis = {Mover(A, ?, B)}

• Para EmB(C): ações disponíveis = {Mover(C, ?, B)}

• Verificar mutex: Mover(A,Mesa,B) e Mover(C,Mesa,B)

→ NÃO mutex (independentes) ✓

• Seleção: {Mover(A,Mesa,B), Mover(C,Mesa,B)}

Passo 2: Determinar subobjetivos em P₁

• Precondições de Mover(A,Mesa,B): EmMesa(A), MãoVazia

• Precondições de Mover(C,Mesa,B): EmMesa(C), MãoVazia

• Subobjetivos: {EmMesa(A), EmMesa(C), MãoVazia}

Passo 3: Selecionar ações em A₀

• Para EmMesa(A): ação persistência (já verdadeiro em P₀)

• Para EmMesa(C): ação persistência (já verdadeiro em P₀)

• Para MãoVazia: ação persistência (já verdadeiro em P₀)

Passo 4: Verificar P₀

• Todas as proposições em P₀? Sim ✓

Plano extraído:

• Nível 0: (sem ações necessárias)

• Nível 1: Mover(A,Mesa,B), Mover(C,Mesa,B) [paralelas]

• Conclusão: plano válido de comprimento 1 com paralelismo

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 36

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Propriedades e Garantias do GraphPlan

GraphPlan garante completude: se problema tem solução, algoritmo eventualmente a encontrará expandindo grafo até nível suficiente. A prova baseia-se em observação de que se solução existe com comprimento k, então grafo em nível k conterá metas sem mutexes e extração bem-sucedida é garantida (eventualmente, após backtracking suficiente). Esta garantia teórica proporciona confiança em que falha em encontrar solução após exploração extensiva constitui evidência forte de insolubilidade do problema.

Optimalidade é garantida no sentido de makespan paralelo: GraphPlan retorna plano com menor número de passos temporais considerando execução paralela de ações independentes. Esta noção de optimalidade difere de minimização de número total de ações, sendo mais apropriada para contextos onde paralelismo é possível e tempo total de execução é métrica crítica. Para otimização de número de ações, extensões como GP-BFS modificam estratégia de extração priorizando planos mais curtos independentemente de estrutura paralela.

A eficiência prática do GraphPlan varia significativamente entre domínios: problemas com alto paralelismo beneficiam-se enormemente da representação compacta do grafo, enquanto aqueles essencialmente sequenciais podem ter desempenho inferior a planejadores baseados em busca heurística. Análise empírica nas competições internacionais de planejamento revelou que GraphPlan e seus descendentes como IPP e SGPlan são especialmente competitivos em domínios de logística e robótica onde coordenação de ações paralelas é essencial.

Análise: Completude e Optimalidade

Problema: Blocos do Mundo (4 blocos)

Estado inicial: On(D,C), On(C,A), OnTable(A), OnTable(B)

Meta: On(A,B), On(B,C), On(C,D), OnTable(D)

Expansão do grafo:

Nível 0:

• Metas presentes? Não

• Continuar expansão...

Nível 1:

• Metas presentes? Parcialmente (OnTable(D) possível)

• Mutex entre outras metas? Sim

• Continuar...

Nível 4:

• Todas as metas presentes? Sim ✓

• Mutexes entre metas? Não ✓

• Tentar extração...

Extração:

• Primeira tentativa: falha (deadlock detectado)

• Backtracking: explorar escolhas alternativas

• Tentativa 3: sucesso!

Plano encontrado (comprimento 4):

1. Move(D, C, Table)

2. Move(C, A, D)

3. Move(A, Table, B)

4. Move(B, Table, C)

Optimalidade:

• Plano sequencial ótimo: 4 passos

• Plano paralelo: também 4 (problema essencialmente sequencial)

• GraphPlan garante: não existe solução < 4 passos

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 37

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Extensões e Variantes

Numerosas extensões do GraphPlan abordam limitações do algoritmo original ou adaptam-no para contextos mais complexos. IPP (Integer Programming Planning) traduz grafo de planejamento em programa inteiro onde variáveis booleanas representam inclusão de ações e restrições codificam precondições, efeitos e mutexes. Resolvedores ILP comerciais então encontram atribuições válidas, frequentemente mais rapidamente que backtracking manual do GraphPlan original, explorando décadas de otimizações em programação matemática.

TGP (Temporal GraphPlan) estende framework para ações durativas e restrições temporais métricas, representando não apenas ordering de ações mas também quando precisamente ocorrem no tempo. Esta extensão requer análise mais sofisticada de mutexes considerando sobreposições temporais e propagação de windows temporais admissíveis através dos níveis. Aplicações incluem scheduling de produção industrial onde sincronização precisa de operações é crítica.

SGPlan combina GraphPlan com particionamento do problema em subproblemas independentes resolvidos separadamente e então mesclados, explorando decomposição para escalar para problemas muito grandes. Esta técnica é especialmente eficaz quando dependências entre subobjetivos são esparsas, permitindo paralelização da computação através de múltiplos processadores. LPG (Local search for Planning Graphs) aplica busca local sobre estrutura do grafo, permitindo escapar de mínimos locais através de movimentos que temporariamente pioram qualidade do plano parcial.

Comparação: GraphPlan vs. Variantes

Domínio: Logística complexa (50 locais, 100 pacotes)

GraphPlan clássico:

• Tempo de expansão do grafo: 3.2 segundos

• Tempo de extração: 18.7 segundos

• Comprimento do plano: 47 passos paralelos

• Total: 21.9 segundos

IPP (Integer Programming):

• Tempo de construção do ILP: 4.1 segundos

• Tempo de solução (CPLEX): 5.3 segundos

• Comprimento do plano: 47 passos (mesmo)

• Total: 9.4 segundos (2.3× mais rápido)

SGPlan (com particionamento):

• Identificação de 5 subproblemas independentes: 0.8s

• Resolução paralela de subproblemas: 3.2s cada

• Merge de soluções: 1.1s

• Total: 5.1 segundos (4.3× mais rápido)

LPG (busca local):

• Construção de plano inicial: 2.1 segundos

• Melhoramento local: 6.8 segundos

• Comprimento: 52 passos (sub-ótimo, mas aceitável)

• Total: 8.9 segundos

Análise:

• Particionamento é mais eficaz quando aplicável

• ILP explora otimizações de solvers comerciais

• Trade-off entre optimalidade e velocidade

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 38

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Impacto Histórico e Legado

O surgimento do GraphPlan em 1997 marcou renascimento do planejamento automático como área de pesquisa ativa após período de relativo estagnação. A eficiência dramática comparada a sistemas anteriores demonstrou que abordagens algorítmicas inovadoras podiam superar limitações percebidas como intrínsecas ao planejamento. Esta revitalização catalisa desenvolvimento de nova geração de planejadores que culminou na série de Competições Internacionais de Planejamento, estabelecendo benchmarks rigorosos e estimulando progresso contínuo.

As ideias centrais do GraphPlan - representação compacta de múltiplas alternativas, análise de exclusão mútua, e separação entre expansão de possibilidades e compromisso com escolhas específicas - influenciaram profundamente desenvolvimentos subsequentes. Planejadores baseados em SAT adaptam análise mutex para cláusulas booleanas, enquanto sistemas baseados em CSP exploram propagação de restrições análoga. Mesmo planejadores baseados em busca heurística como FF incorporam variantes de delete-relaxation inspiradas por análise de reachability do GraphPlan.

Pedagogicamente, GraphPlan oferece introdução excepcionalmente clara aos conceitos fundamentais de planejamento automatizado: a estrutura em camadas visualiza propagação de possibilidades através do tempo, relações mutex tornam concretas interações complexas entre ações, e separação de fases ilustra decomposição de problemas computacionalmente difíceis em componentes tratáveis. Estas qualidades tornam GraphPlan referência obrigatória em cursos de inteligência artificial, proporcionando fundação conceitual sobre a qual estudantes constroem compreensão de técnicas mais avançadas.

Lições do GraphPlan

Princípios que transcendem o algoritmo específico:

1. Representação Compacta:

• Grafo codifica exponencialmente muitos planos

• Análise sobre representação compacta mais eficaz que enumeração

2. Análise de Incompatibilidades:

• Identificar o que NÃO pode ocorrer simultaneamente

• Restrições negativas podam espaço tão eficazmente quanto heurísticas positivas

3. Separação de Preocupações:

• Fase 1: identificar possibilidades (expansão)

• Fase 2: escolher entre alternativas (extração)

• Decomposição facilita otimização independente

4. Exploração de Paralelismo:

• Makespan como métrica alternativa a número de ações

• Relevante para domínios com recursos múltiplos

5. Trade-offs Computacionais:

• Pré-processamento (construção do grafo) vs. busca

• Investimento inicial pode compensar através de poda posterior

Aplicabilidade além de planejamento:

• Scheduling, alocação de recursos, síntese de programas

• Princípios gerais para problemas de satisfação de restrições temporais

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 39

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Capítulo 8: Satisfazibilidade em Planejamento

Planejamento como SAT

A codificação de problemas de planejamento como instâncias de satisfazibilidade booleana (SAT) transforma busca por planos em busca por atribuições satisfatórias a variáveis proposicionais, permitindo aplicação de décadas de otimizações em solvers SAT modernos. Pioneiramente proposto por Kautz e Selman em 1992, este approach representa estados através de variáveis fluent@t indicando verdade de fluentes em timestep t, e ações através de variáveis action@t indicando execução de ações. Cláusulas booleanas codificam precondições (se action@t então seus fluents-precond@t), efeitos (se action@t então seus fluents-efeito@(t+1)), e frame axioms (fluentes não-afetados persistem).

A estrutura proposicional resultante pode ter milhões de variáveis e cláusulas mesmo para problemas moderados, mas preserva toda informação do problema original de forma que qualquer modelo satisfatório corresponde a plano válido. Solvers SAT modernos como MiniSAT, CryptoMiniSAT e Glucose empregam técnicas sofisticadas - aprendizado de cláusulas, reinícios não-cronológicos, escolha heurística de variáveis - que permitem resolver instâncias surpreendentemente grandes. Competições anuais SAT impulsionam melhorias contínuas, e planejamento beneficia-se diretamente destes avanços sem necessitar reimplementação de heurísticas especializadas.

A abordagem incremental resolve sequências de instâncias SAT para horizontes temporais crescentes: começando com t=1, incrementar até encontrar instância satisfazível, cujo modelo corresponde a plano ótimo em número de passos. Este schema garante optimalidade enquanto evita especificar a priori comprimento de plano necessário. Técnicas de lifting transferem aprendizado entre instâncias subsequentes, reutilizando cláusulas aprendidas em t-1 como constraints para t, acelerando convergência dramaticamente.

Exemplo: Codificação SAT Básica

Problema simples: Mover robô de A para B

Fluentes: At_A, At_B

Ações: Move_A_B

Horizonte: t ∈ {0, 1}

Variáveis proposicionais:

• At_A@0, At_A@1 (robô em A nos instantes 0 e 1)

• At_B@0, At_B@1 (robô em B nos instantes 0 e 1)

• Move_A_B@0 (ação executada no instante 0)

Cláusulas de estado inicial:

• At_A@0 (verdadeiro)

• ¬At_B@0 (falso)

Cláusulas de meta (instante 1):

• At_B@1 (deve ser verdadeiro)

Cláusulas de precondição:

• Move_A_B@0 → At_A@0 (se move, deve estar em A)

• Equivalente: ¬Move_A_B@0 ∨ At_A@0

Cláusulas de efeito:

• Move_A_B@0 → At_B@1 (mover causa chegar em B)

• Move_A_B@0 → ¬At_A@1 (mover causa sair de A)

Cláusulas de frame axiom:

• (At_B@0 ∧ ¬Move_B_A@0) → At_B@1 (persistência)

Solução SAT:

• At_A@0=V, At_B@0=F, Move_A_B@0=V, At_A@1=F, At_B@1=V

• Tradução: plano = [Move_A_B]

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 40

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Codificações SAT Avançadas

Diferentes esquemas de codificação balanceiam tamanho da instância SAT versus eficiência de propagação de restrições. A codificação clássica inclui frame axioms explícitos para cada fluente e timestep, resultando em O(n·m·t) cláusulas onde n são fluentes, m ações, e t timesteps. Codificações otimizadas como explanatory frame axioms substituem persistência padrão por axiomas que explicam mudanças: fluente muda apenas se ação que o afeta foi executada. Esta reformulação reduz número de cláusulas mantendo equivalência semântica.

Codificações de fluxo exploram estrutura de grafos de causalidade para propagar valores de verdade mais eficientemente, introduzindo variáveis auxiliares que representam fluxo de satisfação de precondições através de ações. Esta técnica é particularmente eficaz em domínios com cadeias causais longas onde propagação unit pode encurtar significativamente busca. Counter-based encodings representam recursos consumíveis através de contadores binários ao invés de variáveis booleanas separadas para cada valor possível, compactando representação drasticamente em problemas com fluentes numéricos.

A escolha de codificação impacta drasticamente desempenho: benchmarks mostram variações de várias ordens de magnitude entre codificações para mesmos problemas. Meta-análise sugere que nenhuma codificação domina universalmente, motivando planejadores adaptativos que selecionam codificação baseado em características detectadas do problema. Ferramentas como Madagascar e MP implementam múltiplas codificações permitindo experimentação empírica para identificação de estratégias mais eficazes por domínio.

Comparação de Codificações

Problema: Logística com 20 locais, 10 pacotes

Codificação Clássica:

• Variáveis: 15.000 (fluentes × timesteps × horizonte)

• Cláusulas: 450.000 (frame axioms dominam)

• Tempo de construção: 1.2s

• Tempo de SAT solver: 18.3s

• Total: 19.5s

Explanatory Frame Axioms:

• Variáveis: 15.000 (mesmo)

• Cláusulas: 120.000 (73% redução)

• Tempo de construção: 0.9s

• Tempo de SAT solver: 7.1s (2.6× mais rápido)

• Total: 8.0s

Codificação de Fluxo:

• Variáveis: 22.000 (adicionais para fluxo)

• Cláusulas: 95.000

• Tempo de construção: 1.5s

• Tempo de SAT solver: 4.8s (3.8× mais rápido)

• Total: 6.3s (melhor)

Análise:

• Mais variáveis não necessariamente pior

• Estrutura das cláusulas crucial para propagação

• Codificação de fluxo permite unit propagation mais eficaz

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 41

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

SAT Incremental e Otimização

A abordagem incremental para planejamento via SAT resolve sequência de instâncias booleanas com horizontes temporais crescentes, explorando o fato de que problema insolúvel em horizonte t permanece insolúvel em horizontes menores. Iniciando com t=1 e incrementando até encontrar instância satisfazível, esta estratégia garante descoberta de plano com menor número de passos temporais. Técnicas de aprendizado de cláusulas transferem conhecimento entre iterações: cláusulas de conflito derivadas durante tentativa em horizonte t-1 frequentemente permanecem válidas para t, acelerando convergência.

Solvers SAT incrementais como MiniSAT-incremental mantêm estado interno entre invocações, permitindo adição de novas variáveis e cláusulas sem reconstruir completamente estruturas de dados. Esta funcionalidade é explorada por planejadores como Madagascar que adicionam progressivamente camadas temporais enquanto preservam aprendizado anterior. Assunções temporárias (assumptions) permitem testar satisfazibilidade sob restrições específicas sem modificar base de cláusulas permanente, facilitando exploração de variações do problema.

Otimização de métricas como custo total ou makespan pode ser implementada através de busca binária sobre possíveis valores, ou através de MaxSAT que generaliza SAT permitindo violar cláusulas soft com penalidades associadas. Por exemplo, minimizar número de ações executadas traduz-se em MaxSAT onde cláusulas hard garantem validade do plano e cláusulas soft preferem que variáveis de ação sejam falsas. Solvers MaxSAT modernos como MaxHS e RC2 encontram atribuições que minimizam peso de violações, produzindo planos ótimos segundo métrica especificada.

Exemplo: SAT Incremental em Ação

Problema: Robô coletando 3 objetos em sala

Tentativa t=1:

• Variáveis: estados em {0,1}, ações em {0}

• SAT solver retorna: UNSAT

• Cláusula aprendida: ¬(meta₁@1 ∧ meta₂@1 ∧ meta₃@1)

(impossível alcançar todas as 3 metas em 1 passo)

Tentativa t=2:

• Adiciona: estados em {2}, ações em {1}

• Reutiliza: cláusula aprendida ainda válida

• SAT solver retorna: UNSAT

• Nova cláusula: precisa de sequência específica

Tentativa t=3:

• Adiciona: estados em {3}, ações em {2}

• Reutiliza: ambas as cláusulas anteriores

• SAT solver retorna: SAT ✓

• Modelo encontrado: Navegar(O1) → Pegar(O1) → Navegar(O2) →

Pegar(O2) → Navegar(O3) → Pegar(O3)

Vantagens do aprendizado:

• Cláusulas de t=1 podaram busca em t=2 e t=3

• Tempo total: 70% menor que resolver t=3 do zero

• Garantia: solução encontrada é ótima em comprimento

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 42

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Comparação de Abordagens de Planejamento

Cada paradigma de planejamento apresenta forças e limitações distintas que os tornam mais ou menos adequados para diferentes classes de problemas. Busca heurística baseada em A* excele em domínios onde heurísticas informativas podem ser computadas eficientemente, proporcionando guidance forte que foca exploração em regiões promissoras do espaço de estados. Esta abordagem é particularmente eficaz quando objetivos são claramente definidos e estrutura causal do domínio permite estimativas precisas de distância até metas.

GraphPlan e suas variantes brilham em problemas com alto potencial para paralelismo, onde múltiplas ações independentes podem executar simultaneamente. A representação compacta do grafo de planejamento captura eficientemente este paralelismo, e análise mutex elimina combinações inválidas precocemente. Contudo, para problemas essencialmente sequenciais com pouco paralelismo, overhead de construir e manter grafo pode superar benefícios, tornando busca heurística mais eficiente.

Planejamento via SAT converte problema em formato que permite aplicação de décadas de otimizações em solvers booleanos, frequentemente superando planejadores especializados através de técnicas gerais de propagação e aprendizado de conflitos. Esta abordagem é especialmente competitiva em problemas onde estrutura proposicional é densa e aprendizado de cláusulas acumula conhecimento reutilizável. HTN domina quando conhecimento procedural sobre estratégias eficazes está disponível e pode ser codificado como métodos de decomposição, reduzindo branching factor através de commitment precoce a abordagens promissoras.

Benchmark: Múltiplos Paradigmas

Domínio: Logística (100 pacotes, 50 locais, 10 caminhões)

FF (busca heurística):

• Tempo: 4.2 segundos

• Estados expandidos: 8.500

• Comprimento do plano: 287 ações sequenciais

• Pontos fortes: heurística delete-relaxation muito informativa

SGPlan (GraphPlan):

• Tempo: 3.1 segundos

• Comprimento: 98 passos paralelos

• Paralelismo médio: 2.9 ações por passo

• Pontos fortes: exploração eficiente de paralelismo

Madagascar (SAT):

• Tempo: 5.7 segundos

• Comprimento: 98 passos (ótimo)

• Instâncias SAT resolvidas: 98 (uma por horizonte)

• Pontos fortes: garantia de otimalidade

SHOP2 (HTN):

• Tempo: 1.8 segundos (melhor)

• Comprimento: 310 ações

• Decomposições exploradas: 145

• Pontos fortes: métodos bem-calibrados para domínio

Análise contextual:

• HTN vence se métodos disponíveis são bons

• GraphPlan melhor para makespan paralelo

• FF excelente equilíbrio velocidade/qualidade

• SAT único com garantia de otimalidade

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 43

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Extensões para Planejamento Probabilístico

Muitos domínios reais envolvem incerteza fundamental sobre efeitos de ações ou estado atual do mundo, requerendo extensões dos frameworks determinísticos estudados anteriormente. Processos de Decisão de Markov (MDPs) modelam planejamento sob incerteza estocástica onde ações têm distribuições probabilísticas sobre estados resultantes. A solução ótima de um MDP é política (mapeamento de estados para ações) ao invés de sequência fixa de ações, permitindo reação adaptativa a diferentes contingências conforme observadas durante execução.

Processos Parcialmente Observáveis (POMDPs) generalizam MDPs permitindo observação ruidosa ou parcial do estado verdadeiro, requerendo raciocínio sobre distribuições de crença (probabilidades sobre possíveis estados). Algoritmos como value iteration e policy iteration computam políticas que maximizam recompensa esperada considerando incerteza tanto em transições quanto em observações. A complexidade computacional aumenta dramaticamente - POMDPs são PSPACE-completos mesmo para horizontes finitos - mas aproximações e heurísticas tornam classes importantes de problemas tratáveis.

Planejamento probabilístico conecta-se com aprendizado por reforço onde estrutura do MDP não é conhecida a priori mas deve ser aprendida através de interação com ambiente. Técnicas como Q-learning e policy gradient methods descobrem políticas eficazes através de tentativa-e-erro guiada, enquanto planejamento baseado em modelo (model-based RL) usa experiência para construir modelo do ambiente e então aplica algoritmos de planejamento sobre modelo aprendido. Esta integração entre planejamento e aprendizado representa fronteira ativa de pesquisa com aplicações em robótica autônoma e controle adaptativo.

Exemplo: MDP Simples

Domínio: Robô navegando com ações ruidosas

Estados: S = {s₁, s₂, s₃, s₄, meta}

Ações: {Norte, Sul, Leste, Oeste}

Transições estocásticas (exemplo):

• Em s₁, ação Norte:

- Probabilidade 0.8: vai para s₂ (sucesso)

- Probabilidade 0.1: vai para s₄ (escorrega esquerda)

- Probabilidade 0.1: permanece em s₁ (não se move)

Recompensas:

• Alcançar meta: +100

• Cada movimento: -1

• Cair em buraco: -50

Política ótima calculada:

• π*(s₁) = Norte (leva a s₂ com 80% chance)

• π*(s₂) = Leste (move em direção à meta)

• π*(s₃) = Sul (evita buraco com margem)

• π*(s₄) = Norte (recupera de erro)

Valor esperado V*(s₁):

• V*(s₁) = -1 + 0.8·V*(s₂) + 0.1·V*(s₄) + 0.1·V*(s₁)

• Resolve sistema de equações de Bellman

• Resultado: V*(s₁) ≈ 72.4

Interpretação:

• Recompensa esperada começando em s₁ seguindo π*

• Política considera trade-off risco/recompensa

• Adaptação dinâmica a observações durante execução

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 44

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Ferramentas e Ecossistema de Software

O ecossistema de planejamento automático inclui rica coleção de ferramentas open-source que implementam diversos paradigmas e técnicas. Fast-Forward (FF) estabeleceu-se como referência para busca heurística, implementando delete-relaxation e enforced hill-climbing que balanceia exploração e exploração eficazmente. Fast Downward oferece framework modular onde heurísticas, algoritmos de busca, e técnicas de pré-processamento podem ser combinados flexivelmente, facilitando experimentação e desenvolvimento de novas abordagens.

Para planejamento via SAT, Madagascar traduz problemas PDDL em instâncias booleanas usando codificações otimizadas, enquanto MP (Markov Planning) implementa múltiplas variantes incluindo MaxSAT para otimização. SHOP2 e PyHiPOP proporcionam implementações robustas de planejamento HTN com diferentes estratégias de busca e expressividade de linguagem de domínio. LAMA combina múltiplas heurísticas através de busca anytime que progressivamente melhora qualidade de soluções, frequentemente vencendo competições internacionais através desta estratégia portfolio.

Validadores como VAL verificam corretude de planos gerados, essenciais para desenvolvimento confiável e debugging. Ferramentas de visualização como PlanViz e VAL-GUI proporcionam interfaces gráficas que facilitam compreensão de planos complexos e análise de comportamento de planejadores. Benchmarks padronizados das International Planning Competitions (IPC) permitem comparação objetiva entre abordagens, impulsionando progresso contínuo através de competição saudável entre grupos de pesquisa globalmente. Este ecossistema rico torna planejamento automático área acessível para estudantes e pesquisadores que podem construir sobre fundações sólidas ao invés de reimplementar funcionalidades básicas.

Recursos para Aprendizado Prático

Planejadores recomendados para iniciantes:

Fast-Forward (FF):

• Download: https://fai.cs.uni-saarland.de/hoffmann/ff.html

• Linguagem: C, compilação simples

• Uso: ./ff -o domain.pddl -f problem.pddl

• Vantagem: rápido e robusto para aprendizado

Fast Downward:

• Mais modular, permite experimentação

• Python + C++, documentação extensa

• Recomendado para projetos de pesquisa

Online Planning Editor:

• http://editor.planning.domains

• Interface web, não requer instalação

• Ideal para experimentação rápida

Domínios de exemplo (IPC):

• Blocks World: clássico, simples para iniciar

• Logistics: escalabilidade, bom para benchmarks

• Rovers: planejamento temporal, mais realístico

Comunidade:

• ICAPS (Int. Conference on Automated Planning)

• Planning.wiki: tutoriais e documentação

• GitHub: repositórios com código comentado

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 45

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Capítulo 9: Aplicações Práticas e Estudos de Caso

Planejamento em Robótica Móvel

Robótica móvel representa domínio de aplicação paradigmático para planejamento automático, onde agentes físicos devem navegar ambientes complexos executando sequências coordenadas de ações para alcançar objetivos específicos. Robôs de serviço em hospitais planejam rotas que entregam medicamentos e suprimentos minimizando distância percorrida enquanto respeitam restrições temporais de entrega e evitam interferência com tráfego humano. A integração de planejamento de alto nível (quais tarefas executar em qual ordem) com planejamento de movimento (como navegar entre localizações) requer coordenação cuidadosa entre camadas abstratas e concretas de reasoning.

Robôs de exploração planetária como os rovers de Marte utilizam planejamento automático para gerenciar autonomia em ambientes onde comunicação com controladores terrestres sofre atrasos de minutos, impossibilitando teleoperation reativa. O sistema EUROPA desenvolvido pela NASA permite especificação de objetivos científicos de alto nível que são automaticamente refinados em sequências detalhadas de comandos para instrumentos e subsistemas de navegação, considerando restrições de energia, capacidade de comunicação, e durações de operações científicas. Esta autonomia possibilita missões mais ambiciosas que exploram território maior com supervisão humana mínima.

Warehouses automatizados empregam frotas de robôs móveis que colaborativamente movem produtos entre estações de armazenamento, empacotamento e expedição. Planejamento multiagente coordena movimentos individuais evitando colisões e deadlocks enquanto otimiza throughput global do sistema. Algoritmos de planejamento temporal garantem sincronização precisa quando múltiplos robôs devem cooperar para manipular cargas grandes demais para unidades individuais, demonstrando integração sofisticada entre planejamento, scheduling, e execução coordenada em ambientes dinâmicos de alta demanda.

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 46

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Estudo de Caso: Robô de Serviço Hospitalar

Consideremos sistema real de robô autônomo operando em hospital universitário, responsável por transportar amostras laboratoriais, medicamentos, e documentos entre departamentos. O planejador hierárquico decompõe missão de alto nível "entregar medicamento do paciente X no quarto Y" em tarefas intermediárias: navegar até farmácia, aguardar preparação (se necessário), carregar medicamento, navegar até andar correto, usar elevador, navegar até quarto, entregar para enfermeira de plantão. Cada decomposição considera estado corrente do robô (localização, carga atual, nível de bateria) e do ambiente (elevadores disponíveis, corredores bloqueados temporariamente).

Replanejamento dinâmico torna-se necessário quando elevador preferido está em manutenção, corredor está temporariamente bloqueado por maca, ou bateria cai abaixo de threshold seguro. Sistema detecta falhas através de monitoramento contínuo de execução, comparando estado observado com estado previsto pelo plano. Quando discrepância significativa é detectada, planejador é reinvocado com estado corrente como novo ponto de partida e objetivos remanescentes como metas, gerando plano alternativo que contorna obstáculos imprevistos. Esta arquitetura sense-plan-act permite operação robusta em ambientes parcialmente imprevisíveis típicos de aplicações do mundo real.

Análise de desempenho após seis meses de operação revelou que robô completa 95% das missões com sucesso sem intervenção humana, sendo 5% restantes casos excepcionais como mau funcionamento de hardware ou situações genuinamente novas não contempladas na biblioteca de métodos. O planejador gera em média planos com 15-20 ações primitivas em menos de 2 segundos, adequado para interatividade requerida. Replanejamento ocorre em aproximadamente 30% das missões, tipicamente devido a elevadores ocupados ou necessidade de recarga de bateria, mas overhead adicional é aceitável (< 3 segundos adicionais por missão). Este caso ilustra viabilidade de planejamento automático em aplicações comerciais reais com requisitos de confiabilidade e performance.

Métricas de Desempenho Real

Período de análise: 6 meses de operação contínua

Volume de missões: 8.247 entregas completadas

Taxa de sucesso sem intervenção: 95.2%

Tempo médio de planejamento inicial: 1.8 segundos

Frequência de replanejamento:

• Nenhum replanejamento: 70% das missões

• 1 replanejamento: 22% das missões

• 2+ replanejamentos: 8% das missões

Causas de replanejamento:

• Elevador ocupado (48%)

• Corredor temporariamente bloqueado (26%)

• Necessidade de recarga de bateria (18%)

• Outros (8%)

Comprimento médio dos planos: 17.3 ações primitivas

Economia vs. planejamento manual:

• Distância percorrida: 12% menor (otimização automática)

• Uso de elevador: 18% redução (agrupamento inteligente)

• Consumo de bateria: 15% mais eficiente

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 47

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Planejamento em Jogos Digitais

Jogos digitais constituem laboratório fascinante para técnicas de planejamento automático, oferecendo ambientes controlados mas complexos onde agentes não-jogadores (NPCs) devem demonstrar comportamentos convincentes e desafiadores. Diferentemente de aplicações industriais onde corretude e optimalidade são prioritárias, jogos valorizam comportamento interessante, variado e "humano", mesmo que ocasionalmente subótimo. Esta diferença de objetivos motiva técnicas específicas como planejamento anytime que retorna rapidamente soluções satisfatórias mas continua refinando se tempo computacional permitir.

Em jogos de estratégia em tempo real (RTS) como StarCraft, planejamento hierárquico permite NPCs raciocinar em múltiplos níveis de abstração: estratégia global (expandir economia vs. atacar agressivamente), táticas regionais (defender base vs. assediar expansão inimiga), e microgerenciamento de unidades individuais (posicionamento em combates). Bibliotecas de métodos HTN codificam expertise sobre diferentes estilos de jogo, permitindo criação de oponentes com personalidades distintas através de variação na preferência por decomposições agressivas, defensivas, ou econômicas. Esta modularidade facilita balanceamento de dificuldade e criação de progressão interessante de desafios.

Jogos de ação-aventura como The Last of Us e Horizon Zero Dawn utilizam planejamento GOAP (Goal-Oriented Action Planning) onde NPCs selecionam dinamicamente objetivos baseado em contexto e então planejam sequências de ações para alcançá-los. Por exemplo, inimigo pode adotar objetivo "flanquear jogador" se jogador está entrincheirado, ou "buscar cobertura" se está ferido e jogador tem linha de tiro clara. O planejador gera comportamento que parece inteligente e adaptativo sem requerer scripting manual de todas as situações possíveis, permitindo emergência de táticas surpreendentes que aumentam replay value e sensação de enfrentar oponentes genuinamente inteligentes.

Implementação GOAP em Jogo de Ação

Contexto: NPC inimigo em combate com jogador

Estado inicial do NPC:

• Saúde: 60%, Munição: 15 balas, Posição: exposta, Distância do jogador: 25m

Objetivos possíveis (priorizados dinamicamente):

1. MantarSobrevivência (prioridade: alta se saúde < 50%)

2. EliminarJogador (prioridade: alta se vantagem tática)

3. SuPortarAliados (prioridade: média se aliados próximos)

Objetivo selecionado: MantarSobrevivência

Ações disponíveis no domínio:

• BuscarCobertura(local): precond={Exposto}, efeitos={EmCobertura, ¬Exposto}

• Atirar(alvo): precond={Munição>0, LinhaVisão}, efeitos={¬Munição, DanoAlvo}

• Recarregar: precond={Munição

• FlanquearJogador: precond={CoberturaDisponível}, efeitos={PosiçãoVantajosa}

Plano gerado (horizonte 4 ações):

1. AtiraSupressivo → mantém jogador recuado

2. BuscarCobertura(pilar-próximo) → aumenta sobrevivência

3. Recarregar → prepara para próximo engajamento

4. FlanquearJogador → busca vantagem tática

Resultado comportamental:

• NPC parece "inteligente": recua quando vulnerável

• Comportamento emergente: não foi explicitamente scriptado

• Adaptativo: se jogador se mover, replanejar

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 48

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Planejamento em Manufatura e Logística

Indústria manufatureira utiliza planejamento automático extensivamente para scheduling de produção, otimização de cadeias de suprimento, e coordenação de operações em fábricas complexas. Scheduling de job shop - problema clássico onde múltiplas tarefas devem ser alocadas a máquinas com restrições de precedência e capacidade - traduz-se naturalmente para planejamento temporal onde ações representam operações de manufatura com durações específicas e recursos compartilhados (máquinas) geram mutexes entre operações concorrentes.

Sistemas de planejamento e scheduling empresarial (ERP) integram planejamento de longo prazo (previsão de demanda e aquisição de materiais) com scheduling de curto prazo (sequenciamento detalhado de operações diárias). Planejadores hierárquicos decompõem objetivos de produção mensal em metas semanais e então em schedules diários, permitindo gerenciamento em múltiplas escalas temporais. Replanejamento é triggado por eventos como quebra de máquinas, atrasos de fornecedores, ou mudanças em pedidos urgentes, requerendo capacidade de adaptação rápida mantendo cumprimento de compromissos críticos.

Logística e distribuição beneficiam-se enormemente de otimização automática de rotas, consolidação de cargas, e scheduling de entregas. Problemas de roteamento de veículos (VRP) com janelas temporais, capacidades de carga, e múltiplos depósitos podem ser formulados como problemas de planejamento com fluentes numéricos e otimização de métricas como distância total percorrida ou número de veículos utilizados. Solvers que combinam planejamento com programação matemática encontram soluções de alta qualidade que reduzem custos operacionais significativamente comparados a rotas planejadas manualmente, com retorno sobre investimento tipicamente recuperando custos de implementação em meses.

Caso: Otimização de Linha de Produção

Contexto: Fábrica de eletrônicos, 5 estações de montagem

Produtos: Smartphones (3 modelos), Tablets (2 modelos)

Restrições:

• Cada estação pode processar 1 item por vez

• Sequência de operações fixa por produto

• Troca de modelo requer setup (10-30 minutos)

• Meta: produzir lote misto minimizando makespan

Formulação como planejamento temporal:

• Ações: Montar_Smartphone_A em Estação_1, etc.

• Durações: extraídas de dados históricos

• Recursos: mutex entre operações na mesma estação

• Objetivo: completar 100 unidades (mix especificado)

Solução manual (baseline):

• Makespan: 8 horas 45 minutos

• Setups: 15 trocas de modelo

• Utilização média de estações: 68%

Solução otimizada por planejador temporal:

• Makespan: 7 horas 20 minutos (16% redução)

• Setups: 9 trocas (agrupamento inteligente)

• Utilização média: 81% (redução de idle time)

Benefício econômico:

• Capacidade aumentada: 16% mais produção no mesmo tempo

• Economia anual estimada: R$ 2.1 milhões

• ROI do sistema de planejamento: 8 meses

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 49

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Assistentes Virtuais e Automação Pessoal

Assistentes virtuais inteligentes como Siri, Alexa e Google Assistant incorporam componentes de planejamento para gerenciar tarefas complexas que requerem coordenação de múltiplos serviços e APIs. Solicitação como "agende reunião com equipe na próxima semana considerando disponibilidade de todos" dispara processo de planejamento que: consulta calendários individuais, identifica slots comuns, verifica disponibilidade de salas de reunião, envia convites, e pode reservar recursos adicionais como equipamento de videoconferência se necessário. Esta orquestração de ações através de múltiplos domínios requer raciocínio sobre dependências e restrições temporais.

Automação residencial inteligente (smart homes) utiliza planejamento para otimizar consumo energético, conforto e segurança simultaneamente. Sistema pode planejar pré-aquecimento de ambiente antes do retorno dos moradores, coordenar operação de eletrodomésticos para evitar picos de demanda que disparam tarifas mais altas, e ajustar iluminação e temperatura gradualmente para maximizar economia mantendo conforto dentro de limites aceitáveis. Sensores que detectam presença, temperatura externa, e previsões meteorológicas informam replanejamento dinâmico que adapta comportamento do sistema a condições variáveis.

Assistentes de produtividade pessoal planejam automaticamente agendas que balanceiam múltiplos objetivos: completar tarefas de alta prioridade antes de deadlines, minimizar tempo de deslocamento entre compromissos, respeitar preferências sobre horários de trabalho focado versus reuniões, e manter buffer para imprevistos. Integração com sistemas de email, calendário, mapas e to-do lists permite visão holística que identifica conflitos e sugere reorganizações inteligentes. Aprendizado de máquina sobre histórico de comportamento refina estimativas de duração de atividades e preferências de scheduling, personalizando planejamento para estilo de trabalho individual.

Cenário: Otimização de Agenda Semanal

Usuário: Executiva com múltiplos compromissos

Entrada semanal:

• 12 reuniões agendadas (durações variáveis)

• 8 tarefas para completar (deadlines específicos)

• 3 compromissos pessoais (horários fixos)

• Preferências: trabalho focado de manhã, reuniões à tarde

Restrições:

• Deslocamento entre escritório e cliente: 45 minutos

• Blocos de trabalho focado: mínimo 90 minutos

• Buffer entre reuniões consecutivas: 15 minutos

• Evitar reuniões após 18h quando possível

Planejamento automático:

Segunda-feira:

• 08:00-10:30: Trabalho focado (relatório trimestral)

• 10:45-11:30: Reunião equipe (escritório)

• 14:00-15:30: Reunião cliente A (externo)

• 16:30-17:30: Reunião cliente B (retorno ao escritório)

Otimizações aplicadas:

• Agrupou reuniões externas em dias específicos

• Protegeu manhãs para trabalho de alta concentração

• Otimizou sequência para minimizar deslocamentos

• Sugestão: mover reunião de terça para quinta (melhor fluxo)

Métricas de qualidade:

• Tempo de deslocamento: 35% redução vs. agenda manual

• Blocos de trabalho focado: 12 horas protegidas

• Satisfação estimada: 8.7/10 (modelo aprendido)

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 50

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Planejamento em Sistemas Educacionais

Sistemas de tutoria inteligente utilizam planejamento para sequenciar conteúdo educacional adaptando-se a conhecimento, estilo de aprendizado, e objetivos específicos de cada estudante. Planejamento instrucional determina ordem ótima para apresentar conceitos considerando dependências de pré-requisitos, dificuldade relativa, e progressão cognitiva apropriada. Por exemplo, sistema pode planejar currículo personalizado para estudante com dificuldade em álgebra mas facilidade em geometria, intercalando tópicos de forma que sucessos em geometria mantenham motivação enquanto álgebra é reforçada gradualmente.

Ambientes de aprendizado baseados em problemas (PBL) empregam planejamento para gerar sequências de desafios que progressivamente desenvolvem competências alvo. Sistema monitora desempenho em exercícios, identifica lacunas de conhecimento através de análise de erros, e planeja intervenções pedagógicas específicas: exemplos adicionais, explicações alternativas, ou prática suplementar em subhabilidades deficientes. Esta personalização automática permite escalabilidade de educação individualizada que seria impossível com recursos humanos limitados, democratizando acesso a tutoria de alta qualidade.

Planejamento de trajetórias acadêmicas auxilia estudantes a navegar currículos complexos com múltiplas eletivas, pré-requisitos, e objetivos de carreira. Sistema pode recomendar sequenciamento de disciplinas que otimiza progresso em direção a graduação enquanto respeita restrições de pré-requisitos, balanceia carga de trabalho entre semestres, e maximiza exposição a áreas de interesse identificadas. Integração com dados de mercado de trabalho informa sugestões sobre especializações emergentes, enquanto análise de históricos de estudantes similares identifica caminhos de sucesso comprovado. Esta aplicação demonstra valor de planejamento além de domínios tradicionalmente associados com robótica e automação industrial.

Reflexão sobre Aplicações

A diversidade de aplicações de planejamento automático ilustra versatilidade dos princípios fundamentais estudados neste volume. Desde robôs em Marte até sistemas educacionais, desde otimização de linhas de produção até coordenação de agendas pessoais, os conceitos centrais - representação de estados, modelagem de ações, busca em espaços de possibilidades, análise de restrições - permanecem relevantes com adaptações específicas de domínio.

Esta transferibilidade reflete poder de abstrações matemáticas apropriadas: ao identificar estrutura formal comum a problemas superficialmente distintos, técnicas de planejamento proporcionam framework unificador que transcende peculiaridades de domínios específicos. Para estudantes desenvolvendo competências em raciocínio lógico e modelagem computacional, dominar estes princípios abre portas para contribuições em áreas diversas onde decisões sequenciais sobre ações devem ser tomadas de forma sistemática e justificável.

O futuro do planejamento automático promete integração ainda mais profunda com outras técnicas de inteligência artificial - aprendizado de máquina para descoberta automática de heurísticas, visão computacional para percepção de ambientes, processamento de linguagem natural para especificação de objetivos em linguagem cotidiana - criando sistemas verdadeiramente autônomos que raciocinam, aprendem, e agem de forma coordenada para alcançar objetivos complexos em ambientes desafiadores do mundo real.

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 51

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Capítulo 10: Tendências e Desenvolvimentos Futuros

Integração com Aprendizado de Máquina

A convergência entre planejamento simbólico e aprendizado de máquina representa fronteira promissora que combina garantias formais de métodos clássicos com adaptabilidade de sistemas data-driven. Aprendizado por reforço profundo demonstrou capacidade de descobrir estratégias impressionantes em domínios como jogos e controle robótico, mas frequentemente carece de interpretabilidade e garantias de segurança essenciais para aplicações críticas. Planejamento simbólico proporciona estrutura que pode guiar exploração, verificar segurança de políticas aprendidas, e proporcionar explicações compreensíveis para decisões autônomas.

Abordagens neurossimbólicas aprendem heurísticas através de redes neurais treinadas em distribuições de problemas específicos de domínios, acelerando planejamento enquanto mantêm framework simbólico subjacente que garante corretude. Estas técnicas superam limitation de heurísticas handcrafted que podem não generalizar bem para variações do problema, permitindo adaptação automática a características específicas de instâncias encontradas em aplicações reais. Meta-aprendizado permite que sistemas aprendam como planejar eficientemente, descobrindo automaticamente quais técnicas funcionam melhor em diferentes contextos.

Verificação formal de sistemas que combinam planejamento e aprendizado permanece desafio aberto fundamental: como garantir que políticas híbridas satisfazem especificações de segurança mesmo quando componentes de aprendizado são essencialmente caixas-pretas? Pesquisas exploram técnicas de certificação onde planejadores simbólicos verificam outputs de sistemas neurais antes de execução, proporcionando camada adicional de segurança que pode ser crucial para deployment em ambientes de alto risco como veículos autônomos e cirurgia robótica.

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 52

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Perspectivas e Conclusões

O planejamento automático permanece área vibrante com aplicações crescentes à medida que sistemas autônomos proliferam em sociedade moderna. Desde veículos autônomos que planejam rotas e manobras, até assistentes virtuais que organizam agendas e coordenam tarefas, até robôs industriais que otimizam sequências de operações manufatureiras, as técnicas estudadas neste volume fundamentam inteligência prática de sistemas que impactam vidas cotidianas. O domínio destes conceitos prepara estudantes não apenas para compreender tecnologias atuais, mas para contribuir com inovações futuras.

A evolução contínua do campo, impulsionada por competições internacionais, colaborações interdisciplinares, e demandas de aplicações industriais, garante que planejamento automático continuará área fértil para pesquisa e desenvolvimento. Desafios persistentes - planejamento sob incerteza profunda, coordenação de múltiplos agentes com objetivos conflitantes, adaptação em tempo real a ambientes dinâmicos imprevisíveis, integração harmoniosa com outras formas de inteligência artificial - oferecem oportunidades ricas para contribuições intelectuais que avançam tanto teoria quanto prática.

Para estudantes brasileiros explorando este campo, as conexões com competências enfatizadas pela BNCC - raciocínio lógico-matemático, resolução sistemática de problemas, modelagem computacional, pensamento algorítmico - são evidentes. As técnicas de planejamento automático não apenas constituem ferramentas técnicas específicas, mas exemplificam princípios gerais de decomposição de problemas complexos, análise formal de alternativas, e construção rigorosa de soluções que transcendem contextos específicos de aplicação, fornecendo fundações intelectuais duradouras para carreiras em ciência, tecnologia, engenharia e matemática.

Mensagem Final aos Estudantes

O estudo do planejamento automático oferece janela privilegiada para compreensão de como inteligência artificial pode ser construída sobre fundamentos matemáticos sólidos, combinando rigor formal com criatividade algorítmica. As técnicas apresentadas neste volume, desde busca heurística até codificações SAT sofisticadas, ilustram poder de abstrações matemáticas adequadas para transformar problemas intratáveis em desafios computacionalmente manejáveis. À medida que continuam suas jornadas educacionais, lembrem que estes princípios - decomposição hierárquica, análise de restrições, exploração guiada de alternativas - aplicam-se muito além de planejamento automatizado, constituindo ferramentas intelectuais valiosas para qualquer domínio que requeira raciocínio sistemático sobre ações e suas consequências em um mundo complexo e dinâmico.

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 53

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações

Referências Bibliográficas

Bibliografia Fundamental

GHALLAB, Malik; NAUS, Dana; TRAVERSO, Paolo. Automated Planning: Theory and Practice. San Francisco: Morgan Kaufmann, 2004.

RUSSELL, Stuart; NORVIG, Peter. Inteligência Artificial. 3ª ed. Rio de Janeiro: Elsevier, 2013.

FIKES, Richard; NILSSON, Nils. STRIPS: A New Approach to the Application of Theorem Proving to Problem Solving. Artificial Intelligence, v. 2, p. 189-208, 1971.

BLUM, Avrim; FURST, Merrick. Fast Planning Through Planning Graph Analysis. Artificial Intelligence, v. 90, p. 281-300, 1997.

KAUTZ, Henry; SELMAN, Bart. Planning as Satisfiability. European Conference on Artificial Intelligence, 1992.

HELMERT, Malte. The Fast Downward Planning System. Journal of Artificial Intelligence Research, v. 26, p. 191-246, 2006.

Bibliografia Especializada

BONET, Blai; GEFFNER, Hector. Planning as Heuristic Search. Artificial Intelligence, v. 129, p. 5-33, 2001.

EROL, Kutluhan; HENDLER, James; NAU, Dana. HTN Planning: Complexity and Expressivity. National Conference on Artificial Intelligence, 1994.

FOX, Maria; LONG, Derek. PDDL2.1: An Extension to PDDL for Expressing Temporal Planning Domains. Journal of Artificial Intelligence Research, v. 20, p. 61-124, 2003.

RICHTER, Silvia; WESTPHAL, Matthias. The LAMA Planner: Guiding Cost-Based Anytime Planning with Landmarks. Journal of Artificial Intelligence Research, v. 39, p. 127-177, 2010.

Bibliografia Complementar

BRASIL. Ministério da Educação. Base Nacional Comum Curricular: Ensino Médio. Brasília: MEC, 2018.

BACCHUS, Fahiem; KABANZA, Froduald. Using Temporal Logics to Express Search Control Knowledge for Planning. Artificial Intelligence, v. 116, p. 123-191, 2000.

HASLUM, Patrik; GEFFNER, Hector. Admissible Heuristics for Optimal Planning. International Conference on Automated Planning and Scheduling, 2000.

Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações
Página 54

Sobre Este Volume

"Inteligência Artificial Simbólica: Planejamento Automático e Suas Aplicações" oferece tratamento abrangente e rigoroso dos fundamentos do planejamento automático em inteligência artificial, desde conceitos básicos de representação de estados até algoritmos avançados e aplicações práticas em robótica, jogos e sistemas autônomos. Este volume 85 da Coleção Escola de Lógica Matemática destina-se a estudantes avançados do ensino médio, graduandos em ciências exatas e educadores interessados nesta fascinante área da IA.

Desenvolvido em conformidade com as diretrizes da Base Nacional Comum Curricular, o livro integra rigor matemático com aplicações práticas relevantes, proporcionando base sólida para compreensão dos fundamentos lógicos e algorítmicos que sustentam sistemas inteligentes modernos. A obra combina desenvolvimento conceitual cuidadoso com exemplos motivadores e análises que desenvolvem competências essenciais de raciocínio formal e modelagem computacional.

Principais Características:

• Fundamentos matemáticos do planejamento automático
• Representação formal de estados, ações e objetivos
• Algoritmos de busca no espaço de estados
• Heurísticas e técnicas de otimização
• STRIPS e linguagens de planejamento modernas
• Planejamento hierárquico e decomposição
• Grafos de planejamento e GraphPlan
• Abordagens baseadas em satisfazibilidade
• Aplicações em robótica e sistemas autônomos
• Estudos de caso e implementações práticas
• Análise de complexidade computacional
• Conexões com tendências contemporâneas em IA

João Carlos Moreira

Universidade Federal de Uberlândia • 2025

CÓDIGO DE BARRAS

9 788585 000850