Uwaga
Uwaga jest mechanizmem selekcji informacji i alokacji zasobów poznawczych. Badania dotyczą tego, kiedy i jak selekcja następuje (modele filtra), jak uwaga jest nakierowywana przestrzennie (Posner) oraz jakie są granice czujności.
Modele selekcji uwagi słuchowej
Efekt cocktail party (Cherry, 1953): choć rozmawiamy z jedną osobą w głośnym pomieszczeniu, słyszymy własne imię wymówione po drugiej stronie sali. Eksperyment Cherrye'go z zadaniem zacienienia (shadowing): badany słucha przez słuchawki dwóch różnych komunikatów jednocześnie (jeden na lewe ucho, drugi na prawe) i powtarza na głos treść jednego z nich. Po zakończeniu zadania pytany jest o treść niezacieniowanego kanału. Wynik: badani nie pamiętają treści semantycznej niezacieniowanego kanału — pamiętają jedynie, czy był tam głos ludzki, jakiej płci, oraz ogólne natężenie głosu.
Model filtra wczesnego (Donald Broadbent, 1958): selekcja uwagi zachodzi na wczesnym, przedsemantycznym etapie. Informacja fizyczna z obu kanałów trafia równolegle do buforu sensorycznego; filtr na podstawie cechy fizycznej (ucho, barwa głosu, intensywność) przepuszcza jeden kanał do dalszej analizy semantycznej, blokując drugi. Model uzasadniał wyniki Cherrye'go.
Model tłumienia Treisman (1960, 1964): Treisman odkryła, że z niezacieniowanego kanału przetwarzane są słowa istotne dla badanego (własne imię, słowa o ładunku emocjonalnym, słowo "pożar"). To niespójne z modelem Broadbenta. Treisman zaproponowała, że niezacieniony kanał nie jest blokowany, lecz tłumiony (attenuated) — jego sygnał jest osłabiony. Słowa z niskim progiem aktywacji (własne imię, niebezpieczne słowa) mogą mimo osłabienia przebyć filtr.
Model selekcji późnej (Deutsch i Deutsch, 1963; Norman, 1968): wszystkie kanały są w pełni analizowane semantycznie, zanim nastąpi selekcja — która dotyczy odpowiedzi, nie percepcji. Selekcja opiera się na trafności bodźca, nie na etapie percepcji. Przewaga: tłumaczy efekty własnego imienia bez problemu Treisman. Wada: nieekonomiczne (po co przetwarzać wszystko?).
Współcześnie panuje pogląd, że czas selekcji jest elastyczny (late selection theory z modyfikacjami, Johnston i Wilson 1980): selekcja może zachodzić wcześnie lub późno, w zależności od zasobów i wymagań zadania.
Teoria Integracji Cech (FIT) — Treisman
Anne Treisman i Garry Gelade (1980) zaproponowali Teorię Integracji Cech (Feature Integration Theory, FIT) — próbę wyjaśnienia, jak odrębne cechy obiektu są łączone w spójny percept.
FIT zakłada dwuetapowe przetwarzanie:
Etap preuwagowy (pre-attentive stage): podstawowe cechy — kolor, orientacja, ruch, głębia, kontrast — wykrywane są równolegle i automatycznie w całym polu wzrokowym. Nie wymaga to skupienia uwagi — cechy "wyskakują" (pop out).
Etap uwagowy (focused attention stage): połączenie cech w spójny obiekt wymaga skupionej uwagi nakierowanej kolejno na każde miejsce. Bez uwagi może dochodzić do iluzorycznych koniunkcji (illusory conjunctions) — błędnego łączenia cech z różnych obiektów (np. postrzegania czerwonego kółka i niebieskiego kwadratu jako niebieskiego kółka).
Operacjonalizacja — poszukiwanie wzrokowe (visual search): - Cel różniący się od dystraktorów jedną cechą (np. czerwony kwadrat wśród niebieskich): czas poszukiwania niezależny od liczby dystraktorów — przeszukiwanie równoległe (~5 ms/bodziec) - Cel różniący się koniunkcją cech (np. czerwony kwadrat wśród czerwonych kół i niebieskich kwadratów): czas rośnie liniowo z liczbą dystraktorów — przeszukiwanie sekwencyjne (~40–50 ms/bodziec)
Metafora: uwaga działa jak "klej" (glue) łączący cechy w spójny obiekt.
FIT doczekała się licznych modyfikacji. Treisman i Sato (1990) dodali supresję dystraktorów z aktywnego szablonu. Cave i Wolfe (1990) zaproponowali model Guided Search — uwaga nie jest losowo kierowana, lecz naprowadzana przez globalne mapy aktywacji.
Architektura map cech: FIT zakłada oddzielne mapy cech (feature maps) dla każdej właściwości zmysłowej — mapa koloru, orientacji, ruchu, głębi. Mapy działają równolegle i niezależnie. Uwaga jak "reflektor" skupiający się na wspólnej mapie topograficznej (master map of locations) integruje cechy z poszczególnych map w spójny percept. Bez skupionej uwagi cechy "pływają" swobodnie i mogą błędnie się łączyć.
Eksperyment IV — przetwarzanie znanych symboli: poszukiwanie litery R wśród P i Q jest szeregowe mimo ich doskonałej znajomości. Nawet dobrze wyuczone obiekty nie są automatycznie integrowane w całości — każda litera pozostaje zbiorem niezwiązanych cech, dopóki uwaga nie zostanie na nią nakierowana. "Czy mózg czyta litery w całości?" — odpowiedź FIT: nie.
Segregacja tekstur: granica oparta na jednej cesze (np. kolor) jest wykrywana preuwagowo, błyskawicznie. Granica oparta na koniunkcji cech (kształt + kolor) jest niewidoczna bez celowego, szeregowego skanowania — stanowi "ślepą plamkę" systemu preuwagowego.



Przestrzenne nakierowywanie uwagi — Posner
Michael Posner (1980) wprowadził paradygmat wskazówki przestrzennej (spatial cueing), który stał się standardowym narzędziem badania uwagi przestrzennej.
Procedura: Na ekranie widoczny jest punkt fiksacji pośrodku. Przed bodźcem docelowym pojawia się wskazówka: - Wskazówka centralna (endogenous): strzałka przy fiksacji wskazująca kierunek — kieruje uwagę dobrowolnie (voluntary / top-down) - Wskazówka peryferyjna (exogenous): błysk w miejscu, gdzie pojawi się cel — przyciąga uwagę automatycznie (involuntary / bottom-up)
Na 20% prób wskazówka jest nieważna (cel w innym miejscu). Wyniki: RT szybszy w warunkach zgodnych (valid cue) niż niezgodnych (invalid cue) — nawet gdy oczy nie poruszają się. Pokazuje to istnienie ukrytej uwagi (covert attention) — uwaga może być przesuwana niezależnie od ruchów gałek ocznych.
Hamowanie powrotu (inhibition of return, IOR, Posner i Cohen, 1984): po odwróceniu uwagi od danego miejsca, powrót do niego jest przez ok. 300–1000 ms hamowany — RT dłuższy dla tego miejsca. Adaptacyjna funkcja: zapobiega re-inspekcji już przetworzonych lokalizacji i sprzyja eksploracji nowych obszarów.
Uwaga endogenna vs. egzogenna: - Egzogenna (peryferyjna): szybka (ok. 100 ms), automatyczna, krótkotrwała (gaśnie po 200–300 ms), podlega IOR - Endogenna (centralna): wolniejsza (~300 ms), wolicjonalna, długotrwała, nie podlega IOR
Czujność i teoria detekcji sygnałów
Czujność (vigilance) to zdolność do utrzymywania gotowości wykrywania rzadkich sygnałów przez dłuższy czas. Mackworth (1948) w eksperymencie z "zegarem Mackwortha" (obracająca się wskazówka, która sporadycznie przeskakuje o dwa kroki) wykazał, że skuteczność detekcji spada już po 30 minutach pracy — dekrement czujności (vigilance decrement). Efekt jest szczególnie silny, gdy sygnały są rzadkie i trudne do wykrycia.
Teoria Detekcji Sygnałów (Signal Detection Theory, SDT, Green i Swets, 1966) dostarcza precyzyjnych narzędzi analizy czujności. SDT oddziela wrażliwość sensoryczną od kryterium decyzyjnego.
Cztery typy odpowiedzi: - Trafienie (hit): sygnał obecny i wykryty - Pominięcie (miss): sygnał obecny, ale niewykryty - Fałszywy alarm (false alarm): sygnał nieobecny, ale zgłoszony - Odrzucenie (correct rejection): sygnał nieobecny i niezgłoszony
Parametr d' (d prime): miara czułości sensorycznej — odległość między rozkładami "szum" i "sygnał + szum" w jednostkach odchylenia standardowego. Wyższe d' = lepsza wrażliwość.
Parametr β (beta): kryterium decyzyjne — gotowość do raportowania sygnału. Niskie β = liberalne kryterium (dużo FA, ale mało pominięć); wysokie β = konserwatywne (mało FA, dużo pominięć).
SDT pozwala precyzyjnie stwierdzić, czy obserwowany dekrement czujności wynika ze spadku wrażliwości sensorycznej (mniejsze d') czy ze zmiany kryterium decyzyjnego (zmiana β). Badania wskazują, że w długotrwałych zadaniach czujności dominuje zmiana kryterium.
Interaktywny wykres SDT
Przesuwaj suwaki, aby zobaczyć, jak d' (wrażliwość) i kryterium decyzyjne wpływają na trafienia, fałszywe alarmy i kryterium β. Zacieniony obszar na prawo od linii kryterium to odpowiedzi „sygnał obecny".
Zasoby uwagi i podzielność
Daniel Kahneman (1973) zaproponował model zasobów uwagi (resource model): uwaga to ograniczony zasób pojemnościowy, który można elastycznie przydzielać różnym zadaniom. Centralne prawidłowości: dwa łatwe zadania można wykonywać jednocześnie (rozmowa + spacer); dwa trudne wzajemnie się zakłócają; trudność zadania określa jego zapotrzebowanie na zasoby.
Model Kahnemana zakłada jedną, centralną pulę zasobów wspólną dla wszystkich zadań. Późniejsze badania wskazały jednak na pewną specjalizację: pula zasobów wzrokowych i słuchowych są częściowo odrębne — dwa zadania wzrokowe bardziej się zakłócają nawet gdy mają te same wymagania co jedno wzrokowe + jedno słuchowe (multiple resource theory, Wickens 1984).
Automatyzm vs. kontrola: Procesy automatyczne nie wymagają zasobów uwagi (np. czytanie słów jest niemal automatyczne dla wykształconego czytelnika), mogą zachodzić równolegle. Procesy kontrolowane wymagają zasobów, są sekwencyjne. Automatyzm nabywa się przez ćwiczenie — Schneider i Shiffrin (1977) wykazali, że po tysiącach prób wykrywanie celów w przeszukiwaniu wzrokowym staje się automatyczne (niezależne od liczby dystraktorów).
Migotanie uwagi (attentional blink, Raymond, Shapiro i Arnell, 1992): w strumieniu bodźców prezentowanych szybko (RSVP, ~10 bodźców/s), jeśli drugi cel (T2) pojawia się 200–500 ms po pierwszym (T1), to T2 jest często nierozpoznany (~50% pominięć). Powyżej 500 ms: pominięcia zanikają. Interpretacja: przetwarzanie T1 "zamraża" uwagę i uniemożliwia konsolidację T2 w pamięci roboczej.
Koszt przełączania zadań
Gdy wykonujemy naprzemiennie dwa różne zadania (np. co próbę zmieniamy między klasyfikacją liczb i liter), obserwuje się koszt przełączenia (switch cost): zadanie wykonywane po zmianie jest wolniejsze i bardziej błędem obarczone niż po powtórzeniu tego samego zadania.
Roger Monsell (2003) wyróżnił dwa składniki kosztu: 1. Koszt konfiguracji (task-set reconfiguration): czas potrzebny na aktywację nowego zestawu procesów i reguł (task set) po sygnale zmiany. Maleje wraz z długością czasu między wskazówką a bodźcem (RSI, response-stimulus interval). 2. Koszt resztkowy (residual switch cost): pozostaje nawet przy bardzo długim RSI — interpretowany jako proaktywna interferencja poprzedniego task-setu.
Przygotowanie (preparation): badani mogą z góry przygotować nowy task-set, jeśli mają wystarczająco dużo czasu. Mimo to pewien koszt resztkowy pozostaje — sugeruje, że poprzednie nastawienie nie jest całkowicie "wymazane", lecz tylko hamowane, i może ponownie "przebijać" (backward inhibition, Mayr i Keele 2000).
Koszt przełączania jest wskaźnikiem elastyczności poznawczej. Jest podwyższony u pacjentów z uszkodzeniami płatów czołowych, w ADHD oraz, normalnie, u osób starszych — co wskazuje na zaangażowanie kontrolnej funkcji kory przedczołowej.
Kluczowe eksperymenty
| Cel | Zbadanie selekcji uwagi słuchowej w warunkach dichoptycznego słuchania (efekt cocktail party) |
| Procedura | Badanym podawano przez słuchawki dwa różne komunikaty werbalne jednocześnie — inny na lewe ucho, inny na prawe. Zadaniem było zacienienie (*shadowing*) jednego kanału — powtarzanie na głos jego treści. Po zakończeniu pytano o treść niezacieniowanego kanału. |
| Wyniki | Badani nie pamiętali nic z treści semantycznej niezacieniowanego kanału. Pamiętali jedynie: czy był tam głos ludzki (tak/nie), płeć głosu, czy głos był na końcu zastąpiony przez ton. Nie rozróżniali języka, treści ani konkretnych słów. |
| Wnioski | Selekcja uwagi jest wczesna i ostra — niezacieniony kanał blokowany na poziomie przedsemantycznym (filtr Broadbenta). Uwaga działa jak filtr, nie wzmacniacz — niezacieniony kanał nie jest w ogóle przetwarzany do poziomu znaczenia. |
| Cel | Empiryczne testowanie teorii integracji cech FIT: porównanie przeszukiwania opartego na cechach vs. koniunkcjach |
| Procedura | Badanym pokazywano matryce zawierające od 1 do 30 bodźców. Cel był zdefiniowany jedną cechą (np. litera X wśród O) lub koniunkcją cech (np. czerwone X wśród niebieskich X i czerwonych O). Mierzono czas odpowiedzi jako funkcję liczby dystraktorów. |
| Wyniki | Cecha prosta: czas niemal niezależny od liczby dystraktorów (~5 ms/element). Koniunkcja cech: czas rósł liniowo (~40–50 ms/element). Przy ograniczonej uwadze (krótka ekspozycja) pojawiały się iluzoryczne koniunkcje. |
| Wnioski | Cechy proste wykrywane preuwagowo i równolegle — efekt "pop-out". Koniunkcje wymagają sekwencyjnego, uwagowego skanowania każdej lokalizacji. Uwaga działa jak "klej" łączący cechy w spójny obiekt — brak uwagi prowadzi do iluzorycznych połączeń. |
| Cel | Wykazanie istnienia ukrytej uwagi przestrzennej i korzyści/kosztów wskazówek przestrzennych |
| Procedura | Na ekranie widoczny punkt fiksacji. Przed pojawieniem się celu prezentowano wskazówkę centralną (strzałka — wskazówka endogenna, 80% ważna) lub peryferyjną (błysk — wskazówka egzogenna). Na 20% prób wskazówka była nieważna. Zadanie: wykryć cel. Badani mieli utrzymywać fiksację. |
| Wyniki | RT szybszy dla ważnych wskazówek (*valid cue*) niż dla nieważnych (*invalid cue*) w obu typach wskazówek, mimo że oczy nie poruszały się. Wskazówki egzogenne działały szybciej (~100 ms), ale ich efekt był krótkotrwały. Po ok. 300 ms po wskazówce peryferyjnej obserwowano hamowanie powrotu (IOR). |
| Wnioski | Uwaga może być przesuwana przestrzennie bez ruchów oczu — ukryta uwaga. Wskazówki egzogenne działają automatycznie i szybko; endogenne — dobrowolnie i wolniej. IOR adaptacyjnie zapobiega re-inspekcji już przetworzonych miejsc. |