Temat 04

Uwaga

Uwaga jest mechanizmem selekcji informacji i alokacji zasobów poznawczych. Badania dotyczą tego, kiedy i jak selekcja następuje (modele filtra), jak uwaga jest nakierowywana przestrzennie (Posner) oraz jakie są granice czujności.

Modele selekcji uwagi słuchowej

Efekt cocktail party (Cherry, 1953): choć rozmawiamy z jedną osobą w głośnym pomieszczeniu, słyszymy własne imię wymówione po drugiej stronie sali. Eksperyment Cherrye'go z zadaniem zacienienia (shadowing): badany słucha przez słuchawki dwóch różnych komunikatów jednocześnie (jeden na lewe ucho, drugi na prawe) i powtarza na głos treść jednego z nich. Po zakończeniu zadania pytany jest o treść niezacieniowanego kanału. Wynik: badani nie pamiętają treści semantycznej niezacieniowanego kanału — pamiętają jedynie, czy był tam głos ludzki, jakiej płci, oraz ogólne natężenie głosu.

Model filtra wczesnego (Donald Broadbent, 1958): selekcja uwagi zachodzi na wczesnym, przedsemantycznym etapie. Informacja fizyczna z obu kanałów trafia równolegle do buforu sensorycznego; filtr na podstawie cechy fizycznej (ucho, barwa głosu, intensywność) przepuszcza jeden kanał do dalszej analizy semantycznej, blokując drugi. Model uzasadniał wyniki Cherrye'go.

Model tłumienia Treisman (1960, 1964): Treisman odkryła, że z niezacieniowanego kanału przetwarzane są słowa istotne dla badanego (własne imię, słowa o ładunku emocjonalnym, słowo "pożar"). To niespójne z modelem Broadbenta. Treisman zaproponowała, że niezacieniony kanał nie jest blokowany, lecz tłumiony (attenuated) — jego sygnał jest osłabiony. Słowa z niskim progiem aktywacji (własne imię, niebezpieczne słowa) mogą mimo osłabienia przebyć filtr.

Model selekcji późnej (Deutsch i Deutsch, 1963; Norman, 1968): wszystkie kanały są w pełni analizowane semantycznie, zanim nastąpi selekcja — która dotyczy odpowiedzi, nie percepcji. Selekcja opiera się na trafności bodźca, nie na etapie percepcji. Przewaga: tłumaczy efekty własnego imienia bez problemu Treisman. Wada: nieekonomiczne (po co przetwarzać wszystko?).

Współcześnie panuje pogląd, że czas selekcji jest elastyczny (late selection theory z modyfikacjami, Johnston i Wilson 1980): selekcja może zachodzić wcześnie lub późno, w zależności od zasobów i wymagań zadania.

Teoria Integracji Cech (FIT) — Treisman

Anne Treisman i Garry Gelade (1980) zaproponowali Teorię Integracji Cech (Feature Integration Theory, FIT) — próbę wyjaśnienia, jak odrębne cechy obiektu są łączone w spójny percept.

FIT zakłada dwuetapowe przetwarzanie:

Etap preuwagowy (pre-attentive stage): podstawowe cechy — kolor, orientacja, ruch, głębia, kontrast — wykrywane są równolegle i automatycznie w całym polu wzrokowym. Nie wymaga to skupienia uwagi — cechy "wyskakują" (pop out).

Etap uwagowy (focused attention stage): połączenie cech w spójny obiekt wymaga skupionej uwagi nakierowanej kolejno na każde miejsce. Bez uwagi może dochodzić do iluzorycznych koniunkcji (illusory conjunctions) — błędnego łączenia cech z różnych obiektów (np. postrzegania czerwonego kółka i niebieskiego kwadratu jako niebieskiego kółka).

Operacjonalizacja — poszukiwanie wzrokowe (visual search): - Cel różniący się od dystraktorów jedną cechą (np. czerwony kwadrat wśród niebieskich): czas poszukiwania niezależny od liczby dystraktorów — przeszukiwanie równoległe (~5 ms/bodziec) - Cel różniący się koniunkcją cech (np. czerwony kwadrat wśród czerwonych kół i niebieskich kwadratów): czas rośnie liniowo z liczbą dystraktorów — przeszukiwanie sekwencyjne (~40–50 ms/bodziec)

Metafora: uwaga działa jak "klej" (glue) łączący cechy w spójny obiekt.

FIT doczekała się licznych modyfikacji. Treisman i Sato (1990) dodali supresję dystraktorów z aktywnego szablonu. Cave i Wolfe (1990) zaproponowali model Guided Search — uwaga nie jest losowo kierowana, lecz naprowadzana przez globalne mapy aktywacji.

Architektura map cech: FIT zakłada oddzielne mapy cech (feature maps) dla każdej właściwości zmysłowej — mapa koloru, orientacji, ruchu, głębi. Mapy działają równolegle i niezależnie. Uwaga jak "reflektor" skupiający się na wspólnej mapie topograficznej (master map of locations) integruje cechy z poszczególnych map w spójny percept. Bez skupionej uwagi cechy "pływają" swobodnie i mogą błędnie się łączyć.

Eksperyment IV — przetwarzanie znanych symboli: poszukiwanie litery R wśród P i Q jest szeregowe mimo ich doskonałej znajomości. Nawet dobrze wyuczone obiekty nie są automatycznie integrowane w całości — każda litera pozostaje zbiorem niezwiązanych cech, dopóki uwaga nie zostanie na nią nakierowana. "Czy mózg czyta litery w całości?" — odpowiedź FIT: nie.

Segregacja tekstur: granica oparta na jednej cesze (np. kolor) jest wykrywana preuwagowo, błyskawicznie. Granica oparta na koniunkcji cech (kształt + kolor) jest niewidoczna bez celowego, szeregowego skanowania — stanowi "ślepą plamkę" systemu preuwagowego.

Feature search vs. conjunction search — typy przeszukiwania wzrokowego
Feature search (pop-out, równolegle) vs. conjunction search (skanowanie szeregowe) — klasyfikacja wg Treisman i Gelade (1980)
Przeszukiwanie przez koniunkcję — T wśród X i T
Conjunction search: zielone T wśród brązowych T i X — czas rośnie ~60 ms/element przy skanowaniu szeregowym
Eksperyment IV: przetwarzanie znanych liter P, Q, R
Eksperyment IV: R wśród P i Q — znajome litery nadal przetwarzane szeregowo, nie automatycznie

Przestrzenne nakierowywanie uwagi — Posner

Michael Posner (1980) wprowadził paradygmat wskazówki przestrzennej (spatial cueing), który stał się standardowym narzędziem badania uwagi przestrzennej.

Procedura: Na ekranie widoczny jest punkt fiksacji pośrodku. Przed bodźcem docelowym pojawia się wskazówka: - Wskazówka centralna (endogenous): strzałka przy fiksacji wskazująca kierunek — kieruje uwagę dobrowolnie (voluntary / top-down) - Wskazówka peryferyjna (exogenous): błysk w miejscu, gdzie pojawi się cel — przyciąga uwagę automatycznie (involuntary / bottom-up)

Na 20% prób wskazówka jest nieważna (cel w innym miejscu). Wyniki: RT szybszy w warunkach zgodnych (valid cue) niż niezgodnych (invalid cue) — nawet gdy oczy nie poruszają się. Pokazuje to istnienie ukrytej uwagi (covert attention) — uwaga może być przesuwana niezależnie od ruchów gałek ocznych.

Hamowanie powrotu (inhibition of return, IOR, Posner i Cohen, 1984): po odwróceniu uwagi od danego miejsca, powrót do niego jest przez ok. 300–1000 ms hamowany — RT dłuższy dla tego miejsca. Adaptacyjna funkcja: zapobiega re-inspekcji już przetworzonych lokalizacji i sprzyja eksploracji nowych obszarów.

Uwaga endogenna vs. egzogenna: - Egzogenna (peryferyjna): szybka (ok. 100 ms), automatyczna, krótkotrwała (gaśnie po 200–300 ms), podlega IOR - Endogenna (centralna): wolniejsza (~300 ms), wolicjonalna, długotrwała, nie podlega IOR

Czujność i teoria detekcji sygnałów

Czujność (vigilance) to zdolność do utrzymywania gotowości wykrywania rzadkich sygnałów przez dłuższy czas. Mackworth (1948) w eksperymencie z "zegarem Mackwortha" (obracająca się wskazówka, która sporadycznie przeskakuje o dwa kroki) wykazał, że skuteczność detekcji spada już po 30 minutach pracy — dekrement czujności (vigilance decrement). Efekt jest szczególnie silny, gdy sygnały są rzadkie i trudne do wykrycia.

Teoria Detekcji Sygnałów (Signal Detection Theory, SDT, Green i Swets, 1966) dostarcza precyzyjnych narzędzi analizy czujności. SDT oddziela wrażliwość sensoryczną od kryterium decyzyjnego.

Cztery typy odpowiedzi: - Trafienie (hit): sygnał obecny i wykryty - Pominięcie (miss): sygnał obecny, ale niewykryty - Fałszywy alarm (false alarm): sygnał nieobecny, ale zgłoszony - Odrzucenie (correct rejection): sygnał nieobecny i niezgłoszony

Parametr d' (d prime): miara czułości sensorycznej — odległość między rozkładami "szum" i "sygnał + szum" w jednostkach odchylenia standardowego. Wyższe d' = lepsza wrażliwość.

Parametr β (beta): kryterium decyzyjne — gotowość do raportowania sygnału. Niskie β = liberalne kryterium (dużo FA, ale mało pominięć); wysokie β = konserwatywne (mało FA, dużo pominięć).

SDT pozwala precyzyjnie stwierdzić, czy obserwowany dekrement czujności wynika ze spadku wrażliwości sensorycznej (mniejsze d') czy ze zmiany kryterium decyzyjnego (zmiana β). Badania wskazują, że w długotrwałych zadaniach czujności dominuje zmiana kryterium.

Interaktywny wykres SDT

Przesuwaj suwaki, aby zobaczyć, jak d' (wrażliwość) i kryterium decyzyjne wpływają na trafienia, fałszywe alarmy i kryterium β. Zacieniony obszar na prawo od linii kryterium to odpowiedzi „sygnał obecny".

kryteriumszumsygnał
ROC — FA → Hit
1.50
0.75
← liberalne (dużo FA)konserwatywne (mało FA) →
1.50
d'
0.75
c
1.00
β
77%
Trafienia
23%
Fałsz. alarmy
rozkład szumu rozkład sygnał + szum trafienia (hit) fałszywe alarmy (FA)

Zasoby uwagi i podzielność

Daniel Kahneman (1973) zaproponował model zasobów uwagi (resource model): uwaga to ograniczony zasób pojemnościowy, który można elastycznie przydzielać różnym zadaniom. Centralne prawidłowości: dwa łatwe zadania można wykonywać jednocześnie (rozmowa + spacer); dwa trudne wzajemnie się zakłócają; trudność zadania określa jego zapotrzebowanie na zasoby.

Model Kahnemana zakłada jedną, centralną pulę zasobów wspólną dla wszystkich zadań. Późniejsze badania wskazały jednak na pewną specjalizację: pula zasobów wzrokowych i słuchowych są częściowo odrębne — dwa zadania wzrokowe bardziej się zakłócają nawet gdy mają te same wymagania co jedno wzrokowe + jedno słuchowe (multiple resource theory, Wickens 1984).

Automatyzm vs. kontrola: Procesy automatyczne nie wymagają zasobów uwagi (np. czytanie słów jest niemal automatyczne dla wykształconego czytelnika), mogą zachodzić równolegle. Procesy kontrolowane wymagają zasobów, są sekwencyjne. Automatyzm nabywa się przez ćwiczenie — Schneider i Shiffrin (1977) wykazali, że po tysiącach prób wykrywanie celów w przeszukiwaniu wzrokowym staje się automatyczne (niezależne od liczby dystraktorów).

Migotanie uwagi (attentional blink, Raymond, Shapiro i Arnell, 1992): w strumieniu bodźców prezentowanych szybko (RSVP, ~10 bodźców/s), jeśli drugi cel (T2) pojawia się 200–500 ms po pierwszym (T1), to T2 jest często nierozpoznany (~50% pominięć). Powyżej 500 ms: pominięcia zanikają. Interpretacja: przetwarzanie T1 "zamraża" uwagę i uniemożliwia konsolidację T2 w pamięci roboczej.

Koszt przełączania zadań

Gdy wykonujemy naprzemiennie dwa różne zadania (np. co próbę zmieniamy między klasyfikacją liczb i liter), obserwuje się koszt przełączenia (switch cost): zadanie wykonywane po zmianie jest wolniejsze i bardziej błędem obarczone niż po powtórzeniu tego samego zadania.

Roger Monsell (2003) wyróżnił dwa składniki kosztu: 1. Koszt konfiguracji (task-set reconfiguration): czas potrzebny na aktywację nowego zestawu procesów i reguł (task set) po sygnale zmiany. Maleje wraz z długością czasu między wskazówką a bodźcem (RSI, response-stimulus interval). 2. Koszt resztkowy (residual switch cost): pozostaje nawet przy bardzo długim RSI — interpretowany jako proaktywna interferencja poprzedniego task-setu.

Przygotowanie (preparation): badani mogą z góry przygotować nowy task-set, jeśli mają wystarczająco dużo czasu. Mimo to pewien koszt resztkowy pozostaje — sugeruje, że poprzednie nastawienie nie jest całkowicie "wymazane", lecz tylko hamowane, i może ponownie "przebijać" (backward inhibition, Mayr i Keele 2000).

Koszt przełączania jest wskaźnikiem elastyczności poznawczej. Jest podwyższony u pacjentów z uszkodzeniami płatów czołowych, w ADHD oraz, normalnie, u osób starszych — co wskazuje na zaangażowanie kontrolnej funkcji kory przedczołowej.

Kluczowe eksperymenty

CelZbadanie selekcji uwagi słuchowej w warunkach dichoptycznego słuchania (efekt cocktail party)
ProceduraBadanym podawano przez słuchawki dwa różne komunikaty werbalne jednocześnie — inny na lewe ucho, inny na prawe. Zadaniem było zacienienie (*shadowing*) jednego kanału — powtarzanie na głos jego treści. Po zakończeniu pytano o treść niezacieniowanego kanału.
WynikiBadani nie pamiętali nic z treści semantycznej niezacieniowanego kanału. Pamiętali jedynie: czy był tam głos ludzki (tak/nie), płeć głosu, czy głos był na końcu zastąpiony przez ton. Nie rozróżniali języka, treści ani konkretnych słów.
WnioskiSelekcja uwagi jest wczesna i ostra — niezacieniony kanał blokowany na poziomie przedsemantycznym (filtr Broadbenta). Uwaga działa jak filtr, nie wzmacniacz — niezacieniony kanał nie jest w ogóle przetwarzany do poziomu znaczenia.
CelEmpiryczne testowanie teorii integracji cech FIT: porównanie przeszukiwania opartego na cechach vs. koniunkcjach
ProceduraBadanym pokazywano matryce zawierające od 1 do 30 bodźców. Cel był zdefiniowany jedną cechą (np. litera X wśród O) lub koniunkcją cech (np. czerwone X wśród niebieskich X i czerwonych O). Mierzono czas odpowiedzi jako funkcję liczby dystraktorów.
WynikiCecha prosta: czas niemal niezależny od liczby dystraktorów (~5 ms/element). Koniunkcja cech: czas rósł liniowo (~40–50 ms/element). Przy ograniczonej uwadze (krótka ekspozycja) pojawiały się iluzoryczne koniunkcje.
WnioskiCechy proste wykrywane preuwagowo i równolegle — efekt "pop-out". Koniunkcje wymagają sekwencyjnego, uwagowego skanowania każdej lokalizacji. Uwaga działa jak "klej" łączący cechy w spójny obiekt — brak uwagi prowadzi do iluzorycznych połączeń.
CelWykazanie istnienia ukrytej uwagi przestrzennej i korzyści/kosztów wskazówek przestrzennych
ProceduraNa ekranie widoczny punkt fiksacji. Przed pojawieniem się celu prezentowano wskazówkę centralną (strzałka — wskazówka endogenna, 80% ważna) lub peryferyjną (błysk — wskazówka egzogenna). Na 20% prób wskazówka była nieważna. Zadanie: wykryć cel. Badani mieli utrzymywać fiksację.
WynikiRT szybszy dla ważnych wskazówek (*valid cue*) niż dla nieważnych (*invalid cue*) w obu typach wskazówek, mimo że oczy nie poruszały się. Wskazówki egzogenne działały szybciej (~100 ms), ale ich efekt był krótkotrwały. Po ok. 300 ms po wskazówce peryferyjnej obserwowano hamowanie powrotu (IOR).
WnioskiUwaga może być przesuwana przestrzennie bez ruchów oczu — ukryta uwaga. Wskazówki egzogenne działają automatycznie i szybko; endogenne — dobrowolnie i wolniej. IOR adaptacyjnie zapobiega re-inspekcji już przetworzonych miejsc.

Powiązane demo

Literatura obowiązkowa

Nęcka, E., Orzechowski, J., Szymura, B. (2007). Psychologia poznawcza. Academica / Wydawnictwo SWPS.

Nęcka, E., Orzechowski, J., Szymura, B., Wichary, S. (2020). Psychologia poznawcza. PWN.

Eysenck, M., Keane, M. T. (2015). Cognitive psychology: A student's handbook. Psychology Press.

Kellog, R. T. (2016). Fundamentals of cognitive psychology. SAGE Publications.

Literatura uzupełniająca

Gagné, N., Franzen, L. (2023). How to run behavioural experiments online. Swiss Psychology Open, 3(1).

Alhadad, S. S. (2018). Visualizing data to support judgement in learning analytics. Journal of Learning Analytics, 5(2), 60–85.

Molinaro, P. F., et al. (2019). Train-the-trainer: Methodology to learn the cognitive interview. Journal of Investigative Psychology, 16(1), 32–43.

© 2026 Aleksander Zębrowski. Materiały edukacyjne.

← Powrót do portfolio