Problemas de Concorrência

Módulo 6 · Aula 1 ~25 min de leitura Nível: Intermediário

Vídeo da aula estará disponível em breve

Por que Concorrência é Difícil

Quando dois ou mais processos (ou threads) acessam dados compartilhados simultaneamente, o resultado pode depender da ordem exata em que as instruções são executadas. Essa dependência da ordem é a raiz de todos os problemas de concorrência.

Um programa sequencial é determinístico: dada a mesma entrada, produz sempre a mesma saída. Um programa concorrente é potencialmente não-determinístico: a mesma entrada pode produzir saídas diferentes dependendo do interleaving (intercalação) das instruções pelo escalonador.

Diagrama — Interleaving de instruções

Thread A              Thread B
────────              ────────
load  R1, [contador]
                      load  R2, [contador]
add   R1, 1
                      add   R2, 1
store [contador], R1
                      store [contador], R2

Se contador = 5 inicialmente:
  Thread A lê 5, soma 1, escreve 6
  Thread B lê 5, soma 1, escreve 6
  Resultado final: 6 (deveria ser 7!)

Esse é o problema: a atualização de B sobrescreveu a de A.
O incremento foi "perdido" (lost update).

Race Conditions

Uma race condition (condição de corrida) ocorre quando o resultado de uma computação depende do timing relativo de dois ou mais fluxos de execução. O nome vem da ideia de que os threads estão "correndo" para acessar o dado primeiro.

C — Race condition clássica

#include <pthread.h>
#include <stdio.h>

int contador = 0;  // variável compartilhada

void* incrementar(void* arg) {
    for (int i = 0; i < 1000000; i++) {
        contador++;  // NÃO é atômico! (load, add, store)
    }
    return NULL;
}

int main() {
    pthread_t t1, t2;
    pthread_create(&t1, NULL, incrementar, NULL);
    pthread_create(&t2, NULL, incrementar, NULL);
    pthread_join(t1, NULL);
    pthread_join(t2, NULL);

    printf("Esperado: 2000000\n");
    printf("Obtido:   %d\n", contador);
    // Resultado típico: algo entre 1000000 e 2000000
    // Nunca é o mesmo valor duas vezes!
    return 0;
}

Compile com gcc -pthread race.c -o race e execute várias vezes. Cada execução produz um resultado diferente. Esse é o sintoma de uma race condition.

Seção Crítica

A seção crítica é o trecho de código onde um processo acessa dados compartilhados. O problema da seção crítica é projetar um protocolo que garanta que, quando um processo está executando sua seção crítica, nenhum outro processo possa executar a dele.

Diagrama — Estrutura da seção crítica

while (true) {
    ┌─────────────────────────────┐
    │  SEÇÃO DE ENTRADA           │  ← protocolo para entrar
    │  (entry section)            │
    └─────────────────────────────┘
    ┌─────────────────────────────┐
    │  SEÇÃO CRÍTICA              │  ← acesso ao recurso compartilhado
    │  (critical section)         │
    └─────────────────────────────┘
    ┌─────────────────────────────┐
    │  SEÇÃO DE SAÍDA             │  ← protocolo para sair
    │  (exit section)             │
    └─────────────────────────────┘
    ┌─────────────────────────────┐
    │  SEÇÃO RESTANTE             │  ← código que não usa recurso
    │  (remainder section)        │     compartilhado
    └─────────────────────────────┘
}

Uma solução correta deve satisfazer 3 propriedades:

1. Exclusão mútua: no máximo 1 processo na seção crítica
2. Progresso: se nenhum processo está na SC e alguém quer entrar,
   a decisão não pode ser adiada indefinidamente
3. Espera limitada (bounded waiting): existe um limite no número
   de vezes que outros processos entram na SC enquanto um
   processo espera

Tentativas de Solução por Software

Antes de vermos as soluções corretas, é instrutivo entender por que as tentativas ingênuas falham.

C — Tentativa 1: variável de turno (alternância estrita)

int turno = 0;  // compartilhada

// Processo 0
while (turno != 0) ;  // espera ocupada (busy wait)
// SEÇÃO CRÍTICA
turno = 1;

// Processo 1
while (turno != 1) ;
// SEÇÃO CRÍTICA
turno = 0;

// Problema: alternância ESTRITA.
// Se P0 precisa entrar duas vezes seguidas, não pode.
// Viola a propriedade de PROGRESSO.

C — Tentativa 2: flags de interesse

bool flag[2] = {false, false};

// Processo i (i = 0 ou 1, j = 1-i)
flag[i] = true;              // "eu quero entrar"
while (flag[j]) ;             // espera o outro sair
// SEÇÃO CRÍTICA
flag[i] = false;

// Problema: DEADLOCK possível!
// Se ambos setam flag = true ao mesmo tempo,
// ambos ficam esperando infinitamente.
// flag[0]=true, flag[1]=true → ambos em while(true)

Algoritmo de Peterson

O algoritmo de Peterson (1981) combina as duas ideias — turno e flags — para criar uma solução correta para dois processos. É elegante e historicamente importante, embora não seja usado na prática moderna.

C — Algoritmo de Peterson

int turno;
bool flag[2] = {false, false};

// Processo i (i = 0 ou 1, j = 1-i)
void entrar_secao_critica(int i) {
    int j = 1 - i;
    flag[i] = true;     // "eu quero entrar"
    turno = j;           // "mas dou a vez ao outro"
    while (flag[j] && turno == j)
        ;                // espero enquanto o outro quer E é a vez dele
}

void sair_secao_critica(int i) {
    flag[i] = false;    // "terminei, não quero mais"
}

/*
 Prova de correção:
 - Exclusão mútua: se ambos querem (flag=true), turno só pode ser
   0 OU 1, então um deles passa e o outro espera.
 - Progresso: se só um quer, flag do outro é false → entra direto.
 - Espera limitada: quem dá a vez (turno=j) garante que o outro
   entre antes de si na próxima iteração.

 Limitação: só funciona para 2 processos.
 Para N processos: algoritmo da padaria (Lamport, 1974).
*/

Peterson em processadores modernos Em CPUs modernas com reordenação de instruções (out-of-order execution) e caches por core, o algoritmo de Peterson não funciona sem barreiras de memória (memory barriers). O compilador e o hardware podem reordenar as escritas em flag e turno, quebrando as garantias. Por isso, na prática, usamos suporte de hardware (instruções atômicas) ou primitivas do SO.

Suporte de Hardware: Instruções Atômicas

Processadores modernos oferecem instruções que executam atomicamente (indivisivelmente) operações de leitura-e-escrita. As duas mais importantes são:

C — Test-and-Set (TAS)

// Implementação conceitual (executa atomicamente no hardware)
bool test_and_set(bool* target) {
    bool antigo = *target;
    *target = true;
    return antigo;  // retorna o valor ANTERIOR
}

// Uso para exclusão mútua:
bool lock = false;  // compartilhada

// Entrada
while (test_and_set(&lock))
    ;  // spin: enquanto retorna true, alguém está na SC

// SEÇÃO CRÍTICA

// Saída
lock = false;

// Em x86: instrução XCHG ou LOCK BTS
// Em ARM: instrução LDREX/STREX

C — Compare-and-Swap (CAS)

// Implementação conceitual (executa atomicamente no hardware)
bool compare_and_swap(int* ptr, int esperado, int novo) {
    if (*ptr == esperado) {
        *ptr = novo;
        return true;   // sucesso
    }
    return false;      // falha: outro thread modificou
}

// Uso: incremento atômico sem lock
void incremento_atomico(int* contador) {
    int antigo, novo;
    do {
        antigo = *contador;
        novo = antigo + 1;
    } while (!compare_and_swap(contador, antigo, novo));
    // Se alguém modificou entre o load e o CAS,
    // CAS falha e tentamos de novo (retry loop).
}

// Em x86: instrução CMPXCHG
// Em C11: atomic_compare_exchange_strong()
// Fundamento de estruturas lock-free

Spinlocks

Um spinlock é um lock implementado com busy waiting usando instruções atômicas. O thread fica em loop (spinning) testando o lock repetidamente até conseguir adquiri-lo.

C — Spinlock com test-and-set

typedef struct {
    int locked;  // 0 = livre, 1 = ocupado
} spinlock_t;

void spin_lock(spinlock_t* lk) {
    while (__sync_lock_test_and_set(&lk->locked, 1))
        ;  // spin até adquirir
}

void spin_unlock(spinlock_t* lk) {
    __sync_lock_release(&lk->locked);
}

/*
 Quando usar spinlock:
 + Seções críticas CURTAS (poucos ciclos)
 + Contexto de kernel onde não pode dormir
 + Sistemas multiprocessador (spin em um core, trabalho no outro)

 Quando NÃO usar:
 - Seções críticas longas (desperdício de CPU)
 - Uniprocessador (spin impede o holder de executar!)
 - User space (prefira mutex com sleep)
*/

Desabilitando Interrupções

Em sistemas uniprocessador, uma abordagem simples é desabilitar interrupções durante a seção crítica. Se o timer não interrompe, o escalonador não roda, e nenhum outro processo pode executar.

C — Desabilitar interrupções (kernel)

// Usado no kernel do Linux (local_irq_disable/enable)
void secao_critica_kernel() {
    unsigned long flags;
    local_irq_save(flags);    // salva e desabilita IRQs

    // SEÇÃO CRÍTICA
    // Nenhuma interrupção pode ocorrer aqui

    local_irq_restore(flags); // restaura estado anterior
}

/*
 Problemas:
 - Só funciona em uniprocessador (outros cores continuam executando!)
 - Se a SC for longa, interrupções de hardware ficam pendentes
   (pode perder dados de I/O, timer fica impreciso)
 - Não disponível em user space (seria um risco de segurança)
 - Usado no kernel apenas para SCs muito curtas e específicas
*/

No harness.os

Os mesmos problemas de concorrência aparecem quando múltiplos agentes acessam o harness simultaneamente. O Neon Postgres que armazena os dados do harness.os resolve isso com MVCC (Multi-Version Concurrency Control) e transações:

Diagrama — Concorrência no harness.os

Problema: dois agentes logam decisões ao mesmo tempo

  Agente A: INSERT INTO decisions (title) VALUES ('usar React')
  Agente B: INSERT INTO decisions (title) VALUES ('usar Vue')

No banco relacional com MVCC:
  - Cada transação vê um SNAPSHOT consistente do banco
  - INSERTs não conflitam (cada um cria nova row)
  - UPDATEs na mesma row: serialização automática
    (um espera o outro commitar, como exclusão mútua)

Na prática, o Postgres é como um lock manager sofisticado:
  - Row-level locks (granularidade fina, não trava tabela inteira)
  - Deadlock detection automático (grafo de espera)
  - Isolamento configurável (READ COMMITTED, SERIALIZABLE)

Comparação com o que vimos:
  Lock do Postgres ≈ mutex com sleep (não spinlock)
  MVCC ≈ copy-on-write (leitores nunca bloqueiam)
  Deadlock detection ≈ algoritmo de detecção com grafo de alocação

Exercícios

Compile e execute o programa da race condition (código acima) 10 vezes. Registre os resultados. Por que são diferentes? Use gcc -pthread -O0 race.c -o race (o -O0 desabilita otimizações que podem mascarar o bug).
No algoritmo de Peterson, se removermos a linha turno = j, qual propriedade é violada? Desenhe um cenário de execução que demonstre o problema.
Explique por que spinlocks são adequados no kernel de um sistema multiprocessador mas inadequados em user space. Considere: o que acontece se o holder do lock é preemptado enquanto está na SC?
Implemente um contador thread-safe usando __sync_fetch_and_add() (extensão GCC para operação atômica). Compare o desempenho com o contador sem proteção usando time ./programa.

Resumo

Verifique seu entendimento

No algoritmo de Peterson para 2 processos, qual é o papel da variável turno?

Indica qual processo está atualmente na seção crítica
Conta quantas vezes cada processo entrou na seção crítica
Desempata quando ambos os processos querem entrar simultaneamente, dando prioridade ao outro
Armazena o PID do processo que criou o lock

Race conditions ocorrem quando o resultado depende do timing de execução de múltiplos threads
A seção crítica deve garantir: exclusão mútua, progresso e espera limitada
O algoritmo de Peterson resolve o problema para 2 processos, mas não funciona em hardware moderno sem barreiras de memória
Instruções atômicas (test-and-set, compare-and-swap) são a base das primitivas de sincronização modernas
Spinlocks são eficientes para seções críticas curtas em multiprocessadores; inadequados para seções longas ou uniprocessadores
Desabilitar interrupções é uma solução simples mas limitada (só kernel, só uniprocessador)

Aula anterior5.3 Implementação de File Systems Próxima aula6.2 Semáforos e Monitores