Uwaga
Uwaga jest mechanizmem selekcji informacji i alokacji <a href="/poznawcza/kontrola-poznawcza">zasobów poznawczych</a>. Badania dotyczą tego, kiedy i jak selekcja następuje (modele filtra), jak uwaga jest nakierowywana przestrzennie (<a href="/poznawcza/posner-cueing">Posner</a>) oraz jakie są granice czujności.
Modele selekcji uwagi słuchowej
Efekt cocktail party (Cherry, 1953): choć rozmawiamy z jedną osobą w głośnym pomieszczeniu, słyszymy własne imię wymówione po drugiej stronie sali. Eksperyment Cherrye'go z zadaniem zacienienia (shadowing): badany słucha przez słuchawki dwóch różnych komunikatów jednocześnie (jeden na lewe ucho, drugi na prawe) i powtarza na głos treść jednego z nich. Po zakończeniu zadania pytany jest o treść niezacieniowanego kanału. Wynik: badani nie pamiętają treści semantycznej niezacieniowanego kanału — pamiętają jedynie, czy był tam głos ludzki, jakiej płci, oraz ogólne natężenie głosu.
Model filtra wczesnego (Donald Broadbent, 1958): selekcja uwagi zachodzi na wczesnym, przedsemantycznym etapie. Informacja fizyczna z obu kanałów trafia równolegle do buforu sensorycznego; filtr na podstawie cechy fizycznej (ucho, barwa głosu, intensywność) przepuszcza jeden kanał do dalszej analizy semantycznej, blokując drugi. Model uzasadniał wyniki Cherrye'go.
Model tłumienia Treisman (1960, 1964): Treisman odkryła, że z niezacieniowanego kanału przetwarzane są słowa istotne dla badanego (własne imię, słowa o ładunku emocjonalnym, słowo "pożar"). To niespójne z modelem Broadbenta. Treisman zaproponowała, że niezacieniony kanał nie jest blokowany, lecz tłumiony (attenuated) — jego sygnał jest osłabiony. Słowa z niskim progiem aktywacji (własne imię, niebezpieczne słowa) mogą mimo osłabienia przebyć filtr.
Model selekcji późnej (Deutsch i Deutsch, 1963; Norman, 1968): wszystkie kanały są w pełni analizowane semantycznie, zanim nastąpi selekcja — która dotyczy odpowiedzi, nie percepcji. Selekcja opiera się na trafności bodźca, nie na etapie percepcji. Przewaga: tłumaczy efekty własnego imienia bez problemu Treisman. Wada: nieekonomiczne (po co przetwarzać wszystko?).
Współcześnie panuje pogląd, że czas selekcji jest elastyczny (late selection theory z modyfikacjami, Johnston i Wilson 1980): selekcja może zachodzić wcześnie lub późno, w zależności od zasobów i wymagań zadania.
Teoria Integracji Cech (FIT) — Treisman
Anne Treisman i Garry Gelade (1980) zaproponowali Teorię Integracji Cech (Feature Integration Theory, FIT) — próbę wyjaśnienia, jak odrębne cechy obiektu są łączone w spójny percept.
FIT zakłada dwuetapowe przetwarzanie:
Etap preuwagowy (pre-attentive stage): podstawowe cechy — kolor, orientacja, ruch, głębia, kontrast — wykrywane są równolegle i automatycznie w całym polu wzrokowym. Nie wymaga to skupienia uwagi — cechy "wyskakują" (pop out). Detekcja tych cech opiera się na hierarchii kory wzrokowej opisanej przez Hubla i Wiesela.
Etap uwagowy (focused attention stage): połączenie cech w spójny obiekt wymaga skupionej uwagi nakierowanej kolejno na każde miejsce. Bez uwagi może dochodzić do iluzorycznych koniunkcji (illusory conjunctions) — błędnego łączenia cech z różnych obiektów (np. postrzegania czerwonego kółka i niebieskiego kwadratu jako niebieskiego kółka).
Operacjonalizacja — poszukiwanie wzrokowe (visual search):
- Cel różniący się od dystraktorów jedną cechą (np. czerwony kwadrat wśród niebieskich): czas poszukiwania niezależny od liczby dystraktorów — przeszukiwanie równoległe (~5 ms/bodziec)
- Cel różniący się koniunkcją cech (np. czerwony kwadrat wśród czerwonych kół i niebieskich kwadratów): czas rośnie liniowo z liczbą dystraktorów — przeszukiwanie sekwencyjne (~40–50 ms/bodziec)
Metafora: uwaga działa jak "klej" (glue) łączący cechy w spójny obiekt.
FIT doczekała się licznych modyfikacji. Treisman i Sato (1990) dodali supresję dystraktorów z aktywnego szablonu. Cave i Wolfe (1990) zaproponowali model Guided Search — uwaga nie jest losowo kierowana, lecz naprowadzana przez globalne mapy aktywacji.
Architektura map cech: FIT zakłada oddzielne mapy cech (feature maps) dla każdej właściwości zmysłowej — mapa koloru, orientacji, ruchu, głębi. Mapy działają równolegle i niezależnie. Uwaga jak "reflektor" skupiający się na wspólnej mapie topograficznej (master map of locations) integruje cechy z poszczególnych map w spójny percept. Bez skupionej uwagi cechy "pływają" swobodnie i mogą błędnie się łączyć. Architektura ta przypomina prawa percepcji postaci Gestaltu.
Eksperyment IV — przetwarzanie znanych symboli: poszukiwanie litery R wśród P i Q jest szeregowe mimo ich doskonałej znajomości. Nawet dobrze wyuczone obiekty nie są automatycznie integrowane w całości — każda litera pozostaje zbiorem niezwiązanych reprezentacji, dopóki uwaga nie zostanie na nią nakierowana. "Czy mózg czyta litery w całości?" — odpowiedź FIT: nie.
Segregacja tekstur: granica oparta na jednej cesze (np. kolor) jest wykrywana preuwagowo, błyskawicznie. Granica oparta na koniunkcji cech (kształt + kolor) jest niewidoczna bez celowego, szeregowego skanowania — stanowi "ślepą plamkę" systemu preuwagowego.
→ Percepcja i detekcja cech · → Reprezentacje umysłowe · → Galeria iluzji wzrokowych



Przestrzenne nakierowywanie uwagi — Posner
Michael Posner (1980) wprowadził paradygmat wskazówki przestrzennej (spatial cueing), który stał się standardowym narzędziem badania uwagi przestrzennej.
Procedura: Na ekranie widoczny jest punkt fiksacji pośrodku. Przed bodźcem docelowym pojawia się wskazówka:
Na 20% prób wskazówka jest nieważna (cel w innym miejscu). Wyniki: RT szybszy w warunkach zgodnych (valid cue) niż niezgodnych (invalid cue) — nawet gdy oczy nie poruszają się. Pokazuje to istnienie ukrytej uwagi (covert attention) — uwaga może być przesuwana niezależnie od ruchów gałek ocznych.
Hamowanie powrotu (inhibition of return, IOR, Posner i Cohen, 1984): po odwróceniu uwagi od danego miejsca, powrót do niego jest przez ok. 300–1000 ms hamowany — RT dłuższy dla tego miejsca. Adaptacyjna funkcja: zapobiega re-inspekcji już przetworzonych lokalizacji i sprzyja eksploracji nowych obszarów. Mechanizm IOR wiąże się z kontrolą inhibicyjną.
Uwaga endogenna vs. egzogenna:
- Egzogenna (peryferyjna): szybka (ok. 100 ms), automatyczna, krótkotrwała (gaśnie po 200–300 ms), podlega IOR
- Endogenna (centralna): wolniejsza (~300 ms), wolicjonalna, długotrwała, nie podlega IOR
→ Wypróbuj interaktywny Paradygmat Posnera · → Percepcja: ruchy gałek ocznych · → Kontrola poznawcza
Czujność i teoria detekcji sygnałów
Czujność (vigilance) to zdolność do utrzymywania gotowości wykrywania rzadkich sygnałów przez dłuższy czas. Mackworth (1948) w eksperymencie z "zegarem Mackwortha" (obracająca się wskazówka, która sporadycznie przeskakuje o dwa kroki) wykazał, że skuteczność detekcji spada już po 30 minutach pracy — dekrement czujności (vigilance decrement). Efekt jest szczególnie silny, gdy sygnały są rzadkie i trudne do wykrycia.
Teoria Detekcji Sygnałów (Signal Detection Theory, SDT, Green i Swets, 1966) dostarcza precyzyjnych narzędzi analizy czujności. SDT oddziela wrażliwość sensoryczną od kryterium decyzyjnego.
Cztery typy odpowiedzi:
- Trafienie (hit): sygnał obecny i wykryty
- Pominięcie (miss): sygnał obecny, ale niewykryty
- Fałszywy alarm (false alarm): sygnał nieobecny, ale zgłoszony
- Odrzucenie (correct rejection): sygnał nieobecny i niezgłoszony
Parametr d' (d prime): miara czułości sensorycznej — odległość między rozkładami "szum" i "sygnał + szum" w jednostkach odchylenia standardowego. Wyższe d' = lepsza wrażliwość.
Parametr β (beta): kryterium decyzyjne — gotowość do raportowania sygnału. Niskie β = liberalne kryterium (dużo FA, ale mało pominięć); wysokie β = konserwatywne (mało FA, dużo pominięć).
SDT pozwala precyzyjnie stwierdzić, czy obserwowany dekrement czujności wynika ze spadku wrażliwości sensorycznej (mniejsze d') czy ze zmiany kryterium decyzyjnego (zmiana β). Badania wskazują, że w długotrwałych zadaniach czujności dominuje zmiana kryterium. Podobną logikę subtraktywną stosuje się w chronometrii mentalnej.
Interaktywny wykres SDT
Przesuwaj suwaki, aby zobaczyć, jak d' (wrażliwość) i kryterium decyzyjne wpływają na trafienia, fałszywe alarmy i kryterium β. Zacieniony obszar na prawo od linii kryterium to odpowiedzi „sygnał obecny".
Zasoby uwagi i podzielność
Daniel Kahneman (1973) zaproponował model zasobów uwagi (resource model): uwaga to ograniczony zasób pojemnościowy, który można elastycznie przydzielać różnym zadaniom. Centralne prawidłowości: dwa łatwe zadania można wykonywać jednocześnie (rozmowa + spacer); dwa trudne wzajemnie się zakłócają; trudność zadania określa jego zapotrzebowanie na zasoby.
Model Kahnemana zakłada jedną, centralną pulę zasobów wspólną dla wszystkich zadań. Późniejsze badania wskazały jednak na pewną specjalizację: pula zasobów wzrokowych i słuchowych są częściowo odrębne — dwa zadania wzrokowe bardziej się zakłócają nawet gdy mają te same wymagania co jedno wzrokowe + jedno słuchowe (multiple resource theory, Wickens 1984).
Automatyzm vs. kontrola: Procesy automatyczne nie wymagają zasobów uwagi (np. czytanie słów jest niemal automatyczne dla wykształconego czytelnika), mogą zachodzić równolegle. Procesy kontrolowane wymagają zasobów, są sekwencyjne. Automatyzm nabywa się przez ćwiczenie — Schneider i Shiffrin (1977) wykazali, że po tysiącach prób wykrywanie celów w przeszukiwaniu wzrokowym staje się automatyczne (niezależne od liczby dystraktorów).
Migotanie uwagi (attentional blink, Raymond, Shapiro i Arnell, 1992): w strumieniu bodźców prezentowanych szybko (RSVP, ~10 bodźców/s), jeśli drugi cel (T2) pojawia się 200–500 ms po pierwszym (T1), to T2 jest często nierozpoznany (~50% pominięć). Powyżej 500 ms: pominięcia zanikają. Interpretacja: przetwarzanie T1 "zamraża" uwagę i uniemożliwia konsolidację T2 w pamięci roboczej.
→ Modele pamięci roboczej · → Kontrola poznawcza i automatyzm · → Chronometria mentalna
Koszt przełączania zadań
Gdy wykonujemy naprzemiennie dwa różne zadania (np. co próbę zmieniamy między klasyfikacją liczb i liter), obserwuje się koszt przełączenia (switch cost): zadanie wykonywane po zmianie jest wolniejsze i bardziej błędem obarczone niż po powtórzeniu tego samego zadania.
Roger Monsell (2003) wyróżnił dwa składniki kosztu:
- Koszt konfiguracji (task-set reconfiguration): czas potrzebny na aktywację nowego zestawu procesów i reguł (task set) po sygnale zmiany. Maleje wraz z długością czasu między wskazówką a bodźcem (RSI, response-stimulus interval).
- Koszt resztkowy (residual switch cost): pozostaje nawet przy bardzo długim RSI — interpretowany jako proaktywna interferencja poprzedniego task-setu.
Przygotowanie (preparation): badani mogą z góry przygotować nowy task-set, jeśli mają wystarczająco dużo czasu. Mimo to pewien koszt resztkowy pozostaje — sugeruje, że poprzednie nastawienie nie jest całkowicie "wymazane", lecz tylko hamowane, i może ponownie "przebijać" (backward inhibition, Mayr i Keele 2000).
Koszt przełączania jest wskaźnikiem elastyczności poznawczej. Jest podwyższony u pacjentów z uszkodzeniami płatów czołowych, w ADHD oraz, normalnie, u osób starszych — co wskazuje na zaangażowanie kontrolnej funkcji kory przedczołowej. Podobne mechanizmy przełączania bada się za pomocą testu WCST.
→ Kontrola poznawcza i funkcje wykonawcze · → Test WCST · → Test Stroopa
Zaburzenia uwagi i ślepota z nieuwagi
Ślepota z nieuwagi (inattentional blindness): niemożność spostrzeżenia wyraźnie widocznego bodźca z powodu skupienia uwagi na innym zadaniu. Klasyczny eksperyment Simonsa i Chabrisa (1999): badani oglądali film z dwoma zespołami podającymi piłkę i liczyli podania jednego z nich. 50% badanych nie zauważyło człowieka w kostiumie goryla, który przez kilka sekund szedł przez środek kadru. Uwaga selektywna skutecznie blokowała percepcję niespodziewanego bodźca mimo że był doskonale widoczny.
Niewidzenie zmian (change blindness): niemożność wykrycia zmian w scenie wizualnej gdy są one wprowadzone w momencie krótkiego zakłócenia percepcyjnego (ruch sakkad, błysk ekranu, cięcie montażowe). Simons i Levin (1998): osoby proszone przez przechodnia o drogę nie zauważały, gdy w trakcie przerwy zasłoniętej grupą robotników rola przechodnia była zastępowana przez inną osobę. Zmianę wykrywało ~50% obserwatorów w warunkach laboratoryjnych. Niewidzenie zmian sugeruje, że percepcja wzrokowa nie buduje szczegółowej, ciągłej reprezentacji całej sceny — przechowujemy jedynie cechy aktualnie ogniskowane przez uwagę.
Połowicze zaniedbywanie (hemispatial neglect): charakterystyczne zaburzenie uwagi przestrzennej po uszkodzeniu prawej kory ciemieniowej. Pacjent zachowuje się, jakby lewa połowa przestrzeni nie istniała — nie rysuje lewej połowy zegara, nie je z lewej strony talerza, nie opisuje lewej połowy wyobrażonego widoku. Mechanizm: prawa półkula kory ciemieniowej kieruje uwagę zarówno w lewo, jak i w prawo; lewa — tylko w prawo. Po uszkodzeniu prawej półkuli prawa dominuje, przesuwając uwagę na prawą stronę. Zobacz też: anatomia mózgu.
→ Percepcja wzrokowa · → Reprezentacje umysłowe · → Galeria iluzji · → Anatomia mózgu


ADHD i rehabilitacja uwagi
ADHD (Attention-Deficit/Hyperactivity Disorder): klinicznie istotne zaburzenie uwagi z trudnościami z podtrzymaniem uwagi, impulsywnością i (w typie mieszanym) nadmierną aktywnością motoryczną. Neurobiologicznie: zmniejszona aktywność i objętość kory przedczołowej, prążkowia i móżdżku; niedobór dopaminy i noradrenaliny. Wydłużony SSRT (czas hamowania motorycznego) jest jednym z najczulszych neurokognitywnych markerów ADHD. Deficyty uwagi w ADHD wiążą się też z ograniczeniami pamięci roboczej.
Rehabilitacja uwagi: po udarach i urazach stosuje się Attention Process Training (wielogodzinny trening adaptacyjny). Neurofeedback EEG umożliwia bezpośredni trening regulacji aktywności kory czołowej. U pacjentów z zaniedbywaniem połowiczym pryzmy optyczne przesuwające pole wzrokowe w lewo — wielotygodniowy trening pryzmatyczny redukuje nasilenie zaniedbywania. Efektywność rehabilitacji bada się też za pomocą testu Stroopa i testu WCST.
→ Kontrola poznawcza i hamowanie · → Metody obrazowania EEG · → Pamięć robocza
Kluczowe eksperymenty
| Cel | Zbadanie selekcji uwagi słuchowej w warunkach dychotycznego słuchania (efekt cocktail party). Powiązane: <a href="/poznawcza/wprowadzenie">paradygmat przetwarzania informacji</a> |
| Procedura | Badanym podawano przez słuchawki dwa różne komunikaty werbalne jednocześnie — inny na lewe ucho, inny na prawe. Zadaniem było zacienienie (*shadowing*) jednego kanału — powtarzanie na głos jego treści. Po zakończeniu pytano o treść niezacieniowanego kanału. Metoda zbliżona do <a href="/poznawcza/wprowadzenie">podwójnego zadania</a>. |
| Wyniki | Badani nie pamiętali nic z treści semantycznej niezacieniowanego kanału. Pamiętali jedynie: czy był tam głos ludzki (tak/nie), płeć głosu, czy głos był na końcu zastąpiony przez ton. Nie rozróżniali języka, treści ani konkretnych słów. |
| Wnioski | Selekcja uwagi jest wczesna i ostra — niezacieniony kanał blokowany na poziomie przedsemantycznym (filtr Broadbenta). Uwaga działa jak filtr, nie wzmacniacz — niezacieniony kanał nie jest w ogóle przetwarzany do poziomu znaczenia. Porównaj z <a href="/poznawcza/pamiec-modele">modelem pamięci sensorycznej</a> i <a href="/poznawcza/percepcja">przetwarzaniem odgórnym</a>. |
| Cel | Porównanie czasu <a href="/poznawcza/percepcja">przeszukiwania wzrokowego</a> opartego na jednej cesze vs. koniunkcji cech — test modelu FIT Treisman |
| Procedura | Badanym pokazywano matryce zawierające od 1 do 30 bodźców. Cel był zdefiniowany jedną cechą (np. litera X wśród O) lub koniunkcją cech (np. czerwone X wśród niebieskich X i czerwonych O). Mierzono <a href="/poznawcza/wprowadzenie">czas odpowiedzi</a> jako funkcję liczby dystraktorów. |
| Wyniki | Cecha prosta: czas niemal niezależny od liczby dystraktorów (~5 ms/element). Koniunkcja cech: czas rósł liniowo (~40–50 ms/element). Przy ograniczonej uwadze (krótka ekspozycja) pojawiały się <a href="/poznawcza/reprezentacje">iluzoryczne koniunkcje</a>. |
| Wnioski | Cechy proste wykrywane preuwagowo i równolegle — efekt "pop-out". Koniunkcje wymagają sekwencyjnego, uwagowego skanowania każdej lokalizacji. Uwaga działa jak "klej" łączący cechy w spójny obiekt — brak uwagi prowadzi do iluzorycznych połączeń. Wynik spójny z architekturą <a href="/poznawcza/percepcja">kory wzrokowej</a> i <a href="/poznawcza/reprezentacje">reprezentacjami umysłowymi</a>. |
| Cel | Wykazanie istnienia ukrytej uwagi przestrzennej i korzyści/kosztów wskazówek przestrzennych. <a href="/poznawcza/posner-cueing">→ Wypróbuj samodzielnie</a> |
| Procedura | Na ekranie widoczny punkt fiksacji. Przed pojawieniem się celu prezentowano wskazówkę centralną (strzałka — <a href="/poznawcza/kontrola-poznawcza">wskazówka endogenna</a>, 80% ważna) lub peryferyjną (błysk — wskazówka egzogenna). Na 20% prób wskazówka była nieważna. Zadanie: wykryć cel. Badani mieli utrzymywać <a href="/poznawcza/percepcja">fiksację</a>. |
| Wyniki | RT szybszy dla ważnych wskazówek (*valid cue*) niż dla nieważnych (*invalid cue*) w obu typach wskazówek, mimo że oczy nie poruszały się. Wskazówki egzogenne działały szybciej (~100 ms), ale ich efekt był krótkotrwały. Po ok. 300 ms po wskazówce peryferyjnej obserwowano hamowanie powrotu (IOR). |
| Wnioski | Uwaga może być przesuwana przestrzennie bez <a href="/poznawcza/percepcja">ruchów oczu</a> — ukryta uwaga. Wskazówki egzogenne działają <a href="/poznawcza/percepcja">automatycznie</a> i szybko; endogenne — <a href="/poznawcza/kontrola-poznawcza">dobrowolnie</a> i wolniej. IOR adaptacyjnie zapobiega re-inspekcji już przetworzonych miejsc. |
| Cel | Ustalenie, na jakim etapie zachodzi selekcja informacji słuchowej — przed <a href="/poznawcza/pamiec-procesy">analizą semantyczną</a> czy po niej |
| Procedura | Paradygmat słuchania dychotycznego: badanym prezentowano jednocześnie różne sekwencje cyfr na lewe i prawe ucho (np. lewe: 3, 4, 5; prawe: 8, 2, 7). Proszono o odtworzenie cyfr. Badano, czy badani preferują odtwarzanie według kanałów (najpierw wszystkie z lewego ucha, potem z prawego) czy według momentów czasowych (pary synchroniczne: 3+8, 4+2, 5+7). <a href="/poznawcza/pamiec-modele">Pojemność STM (7±2)</a> określała limit odtwarzania. |
| Wyniki | Badani odtwarzali cyfry niemal wyłącznie według kanałów — najpierw wszystkie z jednego ucha, potem z drugiego. Przy wymuszonym odtwarzaniu według czasu (pary synchroniczne) popełniali znacznie więcej błędów, a czas odtworzenia był dłuższy. |
| Wnioski | Selekcja informacji zachodzi na podstawie cechy fizycznej kanału (ucho), nie semantycznej treści. Uwaga przetwarza jeden kanał, drugi blokuje przed analizą znaczeniową. Broadbent sformalizował wyniki w modelu filtrowym — pierwszej formalnej teorii uwagi selektywnej. Zobacz <a href="/poznawcza/wprowadzenie">paradygmat przetwarzania informacji</a> i <a href="/poznawcza/pamiec-modele">pamięć sensoryczną</a>. |
Materiały wideo
Test selektywnej uwagi — niewidzialny goryl (Simons & Chabris, 1999) · YouTube
Test uwagi — moonwalking bear · YouTube
Colour changing card trick — ślepota na zmiany · YouTube
Powiązane materialy
Jak oceniasz trudność tego materiału?