Zaufanie do systemów sztucznej inteligencji.
Rola wyjaśniania.

W tym tygodniu ukazała się współredagowana przeze mnie książka pt. „Zaufanie do systemów sztucznej inteligencji”: http://www.wydawnictwopw.pl/index.php?s=karta&id=3800. W jej drugim rozdziale stawiam pewne tezy, które chciałbym niniejszym poddać pod dyskusję. Dotyczą one funkcji wyjaśniających systemów SI oraz ich roli w kształtowaniu relacji zaufania użytkownika do systemu.

Bardzo proszę, aby nie mieć do tych tez zaufania :), spojrzeć na nie krytycznie i wskazać ich słabe punkty…

Tezy są następujące:

1.
Wśród czynników, które wzmacniają zaufanie człowieka do systemów sztucznej inteligencji (SI) na pierwszy plan wybijają się: a) skuteczność – system skutecznie rozwiązuje problemy wchodzące w zakres jego kompetencji, b) zdolność do wyjaśniania – system potrafi wyjaśnić, w sposób przekonujący dla człowieka, dlaczego w danej sytuacji podjął taką a nie inną decyzję; c)  elastyczność i otwartość na krytykę – system może zmienić sposób podejmowania decyzji zależnie od interakcji z użytkownikiem; zwłaszcza w przypadku nieskutecznych działań czy  błędnych decyzji.

2.
Istnieją systemy SI, które wykazują bardzo ograniczoną zdolność do wyjaśniania podejmowanych decyzji, wskutek czego nazywa się je czarnymi skrzynkami (ang. black boxes).  Duża część takich systemów jest oparta na sztucznych sieciach neuronowych (SSN), które nabywają swoje zdolności w drodze niskopoziomowego uczenia się, polegającego na (masowym) modyfikowaniu własności neuronów i połączeń między nimi. Własności te nie przekładają się jednak wprost na wiedzę użytkownika systemu o przyczynach podjęcia przezeń konkretnej decyzji.

3.
Do ogólnych powodów słabych zdolności wyjaśniających niektórych systemów SI (niekoniecznie SSN)  należą: a) zbyt duża złożoność strukturalna systemu (w tym: sterującego nim programu), b) interakcja systemu ze środowiskiem (w tym: uczenie się), c) naśladowanie naturalnych układów do przetwarzania informacji (nie dość dobrze poznanych), d) operowanie na danych niepewnych, e) brak procedur translacji operacyjnych reguł niskiego poziomu na czytelne dla człowieka reguły symboliczne.

4.
Funkcje wyjaśniające systemów SI nie są czymś zbędnym.  Odpowiadają na  naturalną dla człowieka – jako istoty racjonalnej – potrzebę uzasadniania żywionych i przyswajanych sądów, w tym wydawanych i przyjmowanych decyzji.

5.
W aspekcie praktycznym funkcje wyjaśniające są szczególnie ważne wtedy, gdy użytkownik przyjmuje wobec systemu SI zasadę  ograniczonego zaufania (ZOZ): nie ufa mu bezgranicznie, licząc się z możliwością popełniania przezeń błędów. Zgodnie z ZOZ,  zaufanie do systemu jest stopniowalne, a jego poziom musi być tym wyższy, im w większym stopniu system potrafi eliminować błędy i doskonalić swoje działanie.

6.
W świetle zasady ZOZ istotne jest, że systemy generujące wyjaśnienia, są postrzegane przez użytkowników jako systemy zawierające pewien mechanizm monitorujący, który prócz generowania wyjaśnień, pozwala rozpoznać i usunąć odpowiednie błędy. Ponadto, informacje zawarte w wyjaśnieniach, zwłaszcza te, które dotyczą wewnętrznych parametrów systemu, mogą pomóc w udoskonaleniu systemu przez człowieka, np. programistę.

Zachęcam wszystkich do dyskusji nad przytoczonymi tezami. Ich szersze omówienia można znaleźć we wspomnianej wyżej książce, w rozdziale drugim (mojego autorstwa) pod tytułem „Wyjaśnianie, zaufanie i test Turinga”.
Przytaczam niżej obszerny fragment tego rozdziału, który nieco pełniej niż powyższe punkty naświetla mój punkt widzenia.

*****  FRAGMENT ROZDZIAŁU pt. „Wyjaśnianie, zaufanie i test Turinga”
Z KSIĄŻKI „Zaufanie do systemów sztucznej inteligencji”  *****

(…)

Zaufanie a wyjaśnianie. Kontekst psychologiczny

Zaufanie jest relacją natury psychicznej, która polega na tym, że pewna osoba, nazwijmy ją podmiotem zaufania, żywi określonego rodzaju przekonanie co do możliwych  działań drugiej strony, na przykład osoby, zwierzęcia, instytucji, urządzenia czy systemu. Jest ona mianowicie przekonana, że działania te będą zgodne z jej oczekiwaniami, które z kolei mają swoje uzasadnienie w deklaracjach, zobowiązaniach lub technicznych specyfikacjach (w przypadku artefaktów) drugiej strony. Relacja ta ma charakter kontekstowy. Znaczy to, że oczekiwania podmiotu zaufania zależą silnie od tego, czym jest druga strona relacji i jaką funkcję pełni.  Na przykład, czy osoba, której podmiot miałby zaufać, jest pracodawcą, usługodawcą, współpracownikiem, partnerem życiowym etc…

Ponieważ jądrem relacji zaufania są oczekiwania wobec pewnego obiektu (np. osoby), psychologowie bardzo często określają zaufanie za pomocą pojęcia wiarygodności. Oto objaśniający tę kwestię fragment pracy psychologów poznawczych: „Decyzja o zaufaniu opiera się najczęściej na ocenie wiarygodności drugiej osoby. Wiarygodność jest więc podstawą zaufania, a także niezbędnym czynnikiem dla pełnej relacji zaufania. Wiarygodność drugiej osoby oznacza przekonanie, że osoba ta będzie zachowywać się w sposób zgodny z oczekiwaniami.” [Jaklik, Łaguna, 2015]

Kluczową dla relacji zaufania cechę wiarygodności możemy – za M. Szynkiewiczem [2014] – zróżnicować dalej na wiarygodność merytoryczną i wiarygodność etyczno-moralną. Pierwsza zależy od wiedzy, doświadczenia i kompetencji dziedzinowych adresata postawy zaufania, druga – od przejawiających się w jego działaniu norm, zasad i poglądów etycznych. Wiarygodność merytoryczna ma charakter bardziej podstawowy, ponieważ sądy i wybory etyczne muszą dotyczyć działań, które bez należytej wiedzy i bez odpowiednich kompetencji nie mogłyby zostać ani zaplanowane, ani podjęte. Ona też będzie nas interesować w sposób szczególny, ponieważ na obecnym etapie rozwoju systemów informatycznych trudno mówić o maszynach, które autentycznie dokonują samodzielnych wyborów etycznych. Ewentualna etyka czy moralność jest kwestią zewnętrzną – powiązaną z decyzjami ludzi, którzy tak a nie inaczej programują maszyny czy ich używają.

Wyróżniony typ wiarygodności jest weryfikowany w praktyce przez skuteczność działań adresata postawy zaufania. Jest to cecha wpływająca najsilniej na poziom zaufania:  im bardziej efekty działań są zgodne z oczekiwaniami, czyli dają oczekiwany skutek, tym większe zaufanie.  Przykładowo, jeśli pewien chirurg, stawiał w przeszłości trafne diagnozy i przeprowadził wiele udanych operacji, darzymy jego umiejętności wysokim zaufaniem i bez wahania skierujemy się do niego w potrzebie. Warto zauważyć, że wobec niemożności osiągnięcia przez jakikolwiek podmiot idealnej skuteczności działań, zaufanie do niego musi być silnie uzależnione od jego zdolności do poprawy tejże efektywności. Im dany podmiot jest bardziej otwarty na krytykę, im bardziej jest w stanie eliminować błędy w swoim działaniu i zwiększać w ten sposób swoją skuteczność, tym bardziej jest on godny zaufania.
Relacja zaufania pozostaje zatem zakotwiczona w praktyce, jest też ukierunkowana na przyszłość i stopniowalna. Skoro jest stopniowalna, to powstaje pytanie o dodatkowe czynniki, które  istotnie wzmacniają jej siłę.

Twierdzimy, że oprócz kluczowej dla zaufania skuteczności działań (w tym eliminacji błędów zwiększających skuteczność), niezwykle istotną rolę odgrywa tutaj zdolność do wyjaśniania – wyjaśniania motywów działań, stojących za nimi decyzji i przyświecających im celów. Zdolność ta ma zarówno pewne walory praktyczne (o czym powiemy szerzej w kontekście systemów SI), jak i czysto psychologiczne, związane z naturalną dla człowieka potrzebą poszukiwania i uzyskiwania wyjaśnień.

W bliskim psychologii kontekście epistemologicznym kwestia druga wiąże się z samym pojęciem wiedzy, ku której człowiek – jako istota rozumna – w sposób naturalny podąża. W każdej definicji wiedzy podkreśla się czynnik uzasadnienia: jest to zbiór sądów, które oprócz innych własności, muszą posiadać dostatecznie dobre uzasadnienie (por. [Ajdukiewicz, 2006], [Chisholm 1994], [Stacewicz, 2021]). To ostatnie zaś, w formie dostępnej dla człowieka czyli intersubiektywnie komunikowalnej, przyjmuje postać wyjaśnienia, które odpowiada na pytanie „dlaczego?”. Na przykład: „Dlaczego lekarz interpretujący wyniki badań wydał sąd określający konkretną diagnozę i konkretną terapię”. Dostępności tego rodzaju wyjaśnień oczekujemy od każdego eksperta i każdego systemu, który wchodzi w jego rolę. Z samej definicji wiedzy jako czegoś intersubiektywnie dostępnego i komunikowalnego [Ajdukiewicz, 2003] wynika zatem, że wiarygodność merytoryczna – zależna od wiedzy i zdolności jej wykorzystywania – musi być weryfikowana między innymi w oparciu o wyjaśnienia adresata postawy zaufania.

Zaufanie a wyjaśnianie. Kontekst systemów sztucznej inteligencji

Relacja zaufania człowieka do systemów informatycznych – jako relacja natury psychologicznej, której główną stroną jest człowiek –  musi mieć swój mentalny wzorzec w relacjach międzyludzkich. Obserwacja ta idzie w parze z ideą testu Turinga, który nakłada na program sztucznej inteligencji sztywne więzy podobieństwa systemów SI  do człowieka. Wymóg podobieństwa sprawia, że na zaufanie człowieka do systemu niejako podwójnie wpływają wzorce kształtowane w kontaktach międzyludzkich: po pierwsze dlatego, że podmiotem relacji jest człowiek, po drugie zaś dlatego, że system informatyczny ma przypominać człowieka.
Mając to wszystko na uwadze, uwzględniając przy tym nowy kontekst interesującej nas relacji, możemy uwypuklić ponownie dwa czynniki wzmacniające zaufanie i dodać do nich trzeci. Są to:

    • skuteczność – system skutecznie rozwiązuje problemy wchodzące w zakres jego kompetencji (im lepsze statystyki poprawnie realizowanych zadań, tym większe zaufanie użytkownika);
    • zdolność do wyjaśniania – system potrafi wyjaśnić, w sposób przekonujący dla człowieka, dlaczego w danej sytuacji podjął taką a nie inną decyzję (jednym z możliwych sposobów wyjaśniania jest zrozumiała dla człowieka rekonstrukcja kroków, które doprowadziły do decyzji);
    • elastyczność i otwartość na krytykę – system może zmienić sposób podejmowania decyzji zależnie od interakcji z użytkownikiem; zwłaszcza w przypadku nieskutecznych działań, błędnych decyzji etc…

Z dwoma ostatnimi czynnikami wiąże się coś, co moglibyśmy nazwać zasadą  ograniczonego zaufania: użytkownik nie ufa systemowi bezgranicznie, licząc się z możliwością popełniania przezeń błędów. W świetle tak rozumianej zasady zaufanie do systemu jest stopniowalne, a jego poziom musi być tym wyższy, im w większym stopniu system potrafi eliminować błędy i doskonalić swoje działanie. Sprzyjają temu obecne w jego oprogramowaniu moduły uczenia się, ale ponadto, silnie powiązana z mechanizmami naprawczymi zdolność do generowania wyjaśnień.
Stawiamy tezę, że przy akceptacji zasady ograniczonego zaufania istotnie wzrasta rola zdolności do generowania wyjaśnień jako czynnika wzmacniającego wiarygodność systemu. Jeśli użytkownik akceptuje zasadę, a więc jest świadom możliwych błędów w działaniu maszyny, to w sposób naturalny łączy wiarygodność ze zdolnością do poprawy tegoż działania. Chodzi przy tym o perspektywę długoterminową, wykraczającą poza wąski horyzont aktualnie realizowanych zadań. Im większe zdolności naprawcze systemu, tym wyższy poziom zaufania do niego w długoterminowej perspektywie aktualnych i przyszłych zadań.

Mechanizm generowania wyjaśnień jest w tym kontekście niezwykle ważny. Generując wyjaśnienia, system nie tylko zaspokaja pewną epistemiczną potrzebę użytkownika (potrzebę poznania uzasadnień czy wyjaśnień), lecz dostarcza mu silnej przesłanki za tym, że w systemie istnieje pewien mechanizm monitorujący, który prócz generowania wyjaśnień, pozwala rozpoznać i usunąć odpowiednie błędy. Ponadto, informacje zawarte w wyjaśnieniach, zwłaszcza te, które dotyczą wewnętrznych parametrów systemu, mogą pomóc w udoskonaleniu systemu przez człowieka, np. programistę. W kontekście możliwej przebudowy układ taki jest więc bardziej godny zaufania niż układ nie dostarczający wyjaśnień.

Chociaż obydwa powiązane ze sobą czynniki – zdolność do generowania wyjaśnień i zdolność do uczenia się – uznaliśmy za pozytywnie wpływające na zaufanie, to trzeba zwrócić uwagę na inny, bardziej negatywny aspekt ich wzajemnej relacji. Otóż mechanizm uczenia się, a dokładniej zmiany powstające w wyniku jego działania,  uznaje się za jedną z głównych przyczyn nieprzejrzystości poznawczej systemów informatycznych oraz trudnej interpretowalności uzyskiwanych przezeń wyników [Zednik 2021], [Stacewicz, Greif, 2021]. Typowy proces narastania nieprzejrzystości polega na tym, że w efekcie uczenia się do systemu są wprowadzane pewne techniczne parametry, które mają na celu dostosowanie działania systemu do wymogów realizowanego zadania, nie pozwalają natomiast uchwycić istotnej i zrozumiałej dla człowieka relacji między danymi a wynikami. Problem ten pogłębia się, gdy proces uczenia się zależy istotnie od kroków losowych, które (ponownie) mają zapewnić efektywność systemu, nie zaś przejrzystą dla człowieka formę wyjaśnienia. Okazuje się zatem, że chociaż zdolność do uczenia się skutkuje poprawą jakości działania systemu i jako taka wzmacnia relację zaufania, to w przypadku pewnych form uczenia się – takich mianowicie, które prowadzą do nieprzejrzystości poznawczej układu – relacja zaufania zostaje osłabiona.

Narzucającym się rozwiązaniem tego problemu jest powiązanie uczenia się z wyjaśnianiem w taki sposób, aby w obydwa procesy był zaangażowany ten sam mechanizm monitorowania pracy systemu. Z jednej strony, wyniki działania tego mechanizmu, czyli rejestrowane zmiany systemu, byłyby podstawą uczenia się (korzystnych zmian w systemie), a z drugiej strony, byłyby one wykorzystywane w procesie wyjaśniania (odnoszącym się również do stanów wewnętrznych systemu).

(…)

Jeszcze raz zachęcam wszystkich do dyskusji :).

W dalszej rozmowie mogą okazać się przydatne również pewne dodatkowe materiały:

1)  The “black box” metaphor in machine learning
2)  Fragment mojej książki, dotyczący problemu czarnej skrzynki
3)  Starszy wpis w blogu o przejrzystości poznawczej systemów algorytmicznych

Paweł Stacewicz

Zaszufladkowano do kategorii Dydaktyka logiki i filozofii, Epistemologia i ontologia, Etyka, Filozofia informatyki, Filozofia nauki, Światopogląd informatyczny | 11 komentarzy

Jakie cechy sztucznej inteligencji miałyby świadczyć o jej inteligencji?

Od systemów sztucznej inteligencji (SI) oczekujemy coraz więcej…
Na przykład: wiarygodności, życzliwości (w tej sprawie zobacz poprzedni wpis),  działań budzących zaufanie czy przestrzegania etycznych norm.
Świadczy to niewątpliwie o tym, że inteligencja systemów SI stała się dla nas czymś oczywistym, naturalnym, nie budzącym wątpliwości. Podobnie jak w stosunku do ludzi, przyjmujemy za oczywiste, że system wykazuje inteligencję, a przyjmując to, idziemy o krok dalej. Stawiamy wymagania dotyczące możliwych sposobów jej wykorzystania, w tym takich, które są dla nas potencjalnie niebezpieczne.
Przykładowo: jeśli system SI zastępuje lekarza lub prawnika, a więc dokonuje odpowiednich ekspertyz i dochodzi do trafnych decyzji, to oczekujemy, by decyzje te spełniały pewne dodatkowe warunki — były opatrzone przejrzystymi dla nas uzasadnieniami, nie godziły w nasze prawa, nie naruszały ogólnie przyjętych norm moralnych itp… Oczekiwania te mają psychologiczny sens pod warunkiem, że systemowi przypisujemy – niejako domyślnie – tego rodzaju zdolności, które w odniesieniu do ludzi nazywamy „inteligencją”.

Czy faktycznie jednak kwestia inteligencji systemów SI jest zamknięta?
W szczególności: czy definiując inteligencję sztuczną na podobieństwo naturalnej, mamy jasność co do typów zdolności, które świadczą o jej istnieniu i pozwalają mierzyć jej poziom?
Która ze zdolności jest tu najważniejsza:  zdolność do rozwiązywania problemów (w domyśle: wystarczająco trudnych),  umiejętność uczenia się, czy może kreatywność i ogólnie pojęte zdolności twórcze…?

A może strategia  definiowania inteligencji, poprzez wskazywanie konstytuujących ją cech (zdolności) prowadzi donikąd? Być może trzeba postąpić tak, jak jeden z pionierów badań nad SI, Marvin Minsky, który charakteryzując nowo-powstającą dyscyplinę, użył  takiego oto  określenia: „Nauka o maszynach realizujących zadania, które wymagają inteligencji wtedy, gdy są wykonywane przez ludzi”.
Poprzez cytowane stwierdzenie Minsky ominął sprytnie pytanie o to, na czym polega inteligencja, czyli jakie cechy ją konstytuują. Zamiast na nie odpowiadać, wystarczy stworzyć katalog problemów, do których rozwiązania jest niezbędna – tak czy inaczej pojęta – ludzka inteligencja. Jeśli maszyny będą potrafiły tym problemom sprostać, będziemy mogli je określić mianem inteligentnych.

Proponuję zastanowić się wspólnie nad różnymi możliwymi strategiami definiowania i rozpoznawania sztucznej inteligencji.
Pytanie główne brzmi: Jakie cechy konstytutywne winna posiadać sztuczna inteligencja?
Ewentualnie, przyjmując strategię Minsky’ego: Jakiego typu problemy powinna rozwiązywać?

Jako materiał pomocniczy do rozmowy proponuję pewien swój tekst, zaczerpnięty z książki „Umysł a modele maszyn uczących się…”. Zwracam w nim uwagę na fakt, że na polu psychologii problem definiowania i pomiaru inteligencji jest wciąż otwarty. Czynię to z intencją uświadomienia czytelnikowi, że ten sam problem dotyczy systemów sztucznych — o których coraz częściej sądzimy, że posiadają inteligencję.

A oto wspomniany tekst (po minimalnych zmianach):

<< Próbując definiować sztuczną inteligencję – czy to jako dyscyplinę naukową, czy to jako pewną właściwość systemów informatycznych – jako naturalny „układ odniesienia” przyjmuje się najczęściej inteligencję ludzką. Czyniąc tak, zakłada się domyślnie, że istnieje jakaś ogólnie przyjęta wykładnia tej ostatniej. Tymczasem, jak dotychczas, ani na polu psychologii, ani na polu neurofizjologii, ani na polu innych nauk o człowieku nie udało się wypracować żadnego powszechnie obowiązującego ujęcia inteligencji. Przeważnie traktuje się ją jako zdolność do rozwiązywania problemów – zdolność stopniowalną i mierzalną za pomocą specjalnych testów (np. testów na IQ). Już tutaj jednak występują znaczne różnice zdań, co do struktury zdolności elementarnych (ich typów, liczby i wzajemnych powiązań), których miałyby dotyczyć niezbędne pomiary. Rozbieżności głębsze ogniskują się wokół następującej alternatywy: czy intelekt należy traktować jako już uformowany zespół umiejętności aktywizowanych w działaniu (tj. przy rozwiązywaniu problemów), czy też jako pewien wiedzotwórczy potencjał, odpowiedzialny za pozyskiwanie nowych umiejętności (tj. uczenie się nowych strategii rozwiązywania problemów). Zgodnie ze stanowiskiem pierwszym miarą inteligencji jednostki byłaby trudność wykonywanych zadań, zgodnie z drugim – stopień trudności materiału, który jednostka jest w stanie, na bazie dotychczasowej wiedzy, przyswoić. Okazuje się, że wielu psychologów opowiada się za stanowiskiem drugim, a tym samym podkreśla dynamiczny i otwarty charakter intelektu. Na przykład W. Stern traktuje inteligencję jako zdolność adaptacji do nowych warunków i do wykonywania nowych zadań, a G.A. Ferguson wprost jako zdolność do uczenia się. >>

Zapraszam wszystkich do dyskusji nad różnymi możliwymi sposobami definiowania i rozumienia inteligencji systemów sztucznych…

Paweł Stacewicz

Zaszufladkowano do kategorii Bez kategorii, Dydaktyka logiki i filozofii, Filozofia informatyki, Filozofia nauki, Światopogląd informatyczny, Światopogląd racjonalistyczny | 17 komentarzy

O życzliwości w życiu, etyce i rozmyślaniach nad sztuczną inteligencją

Obecny wpis umieszczam w blogu w imieniu kolegów, dr Bartłomieja Skowrona i dr Marcina Rojszczaka, którzy wystąpili ostatnio na prowadzonym przeze mnie Seminarium z Filozofii Nauki, z intrygującym referatem pt. „Koncepcja życzliwej sztucznej inteligencji. Zagadnienia etyczne i prawne“.

W centrum referatu stało etyczne pojęcie życzliwości (w odróżnieniu od potocznego!) oraz jego rola w projektowaniu wiarygodnych, czyli budzących zaufanie użytkownika, systemów sztucznej inteligencji (SI). Projektowanie było rozumiane szeroko, również w kontekście czegoś, co można by nazwać „infrastrukturą legislacyjną” — a więc takim kształtem regulacji prawnych, które sprzyjałyby tworzeniu systemów życzliwych dla człowieka. W tym kontekście zostały przedstawione najnowsze projekty aktów prawnych Unii Europejskiej, dotyczące aktualnych i możliwych zastosowań SI. Prelegenci oceniali je krytycznie, zwracając uwagę na konieczność głębszego powiązania prawodawstwa z etyką życzliwości.

Tyle tytułem mojego wprowadzenia.

Jako właściwy wstęp do blogowej dyskusji proponuję krótki tekst samych prelegentów, którzy zarysowują etyczne pojęcie życzliwości i stawiają pewne pytania dotyczące życzliwej sztucznej inteligencji…
Powstał on spontanicznie, w efekcie rozmyślań nad spostrzeżeniami i komentarzami uczestników seminarium.

Gorąco zachęcam do rozmowy wszystkich czytelników bloga, nie tylko uczestników seminarium — Paweł Stacewicz

A OTO INICJUJĄCY DYSKUSJĘ TEKST PRELEGENTÓW:

Pojęcie życzliwości pojawia się zarówno w tekstach starożytnych (chociażby w Etyce Nikomachejskiej Arystotelesa), jak i zupełnie współczesnych (spośród tekstów polskich zasługują na uwagę pisma Marii Ossowskiej i Czesława Znamierowskiego). Część etyków, w szczególności etycy angielskiego oświecenia moralnego widzieli w życzliwości podstawę wszelkiej moralności i postulowali prawo o powszechnej obowiązywalności życzliwości.

Niemniej, gdy wspominamy o życzliwości przy okazji różnych publicznych dyskusji, najczęściej spotykamy się z pobłażliwym uśmiechem, który z jednej strony łaskawie i przyjaźnie wspiera ideę wołającą o powszechną życzliwość, a z drugiej strony lekceważąco odnosi się do siły i doniosłości życzliwości. Za tą spontaniczną pobłażliwością stoi takie mniej więcej rozumowanie: „przecież uprzejmość, serdeczność i empatia nie mogą stanowić jakieś trwałej podstawy dla realnych rozstrzygnięć moralnych. Jedni są mili, a inni nie są mili. I tyle w temacie życzliwości”.
W przeciwieństwie do takiej postawy twierdzimy, że życzliwość nie jest ani uprzejmością, ani serdecznością, ani empatią – choć z tymi fenomenami współwystępuje. Co więcej, ze względu na swą siłę oddziaływania ma istotne znaczenie dla projektowania systemów sztucznej inteligencji, na przykład takich, które byłyby używane w zarządzaniu, administracji publicznej czy systemie edukacji. Zatem to nie tyle w temacie!

Twierdzimy, że życzliwość nie jest ani uprzejmością, ani byciem miłym, ani empatią. Wspierając się Etyką Nikomachejską Arystotelesa przyjmujemy, że istotą życzliwości jest dbanie o dobro drugiej osoby: dokładnie o to, co jest właśnie dla tej osoby dobre.
Rodzic może być życzliwy dla dziecka, silnie motywując je do podejmowania działań, które służą jego rozwojowi — niezależnie od tego jednak, może być momentami nieuprzejmy. Podobnie urzędnik, załatwiając sprawę zgodnie z interesem obywatela, może (a nawet powinien!) być życzliwy, choć nie zawsze jest uprzejmy. Oczywiście, życzliwości często towarzyszą uprzejmość, empatia i serdeczność. Nie one jednak są istotą życzliwej postawy.

Wróćmy jednak do sztucznej inteligencji i jej zastosowań publicznych, takich jak publiczna administracja. Wywołując temat życzliwości SI, natykamy się również na pobłażliwe przytakiwanie, wsparte niejawnym sarkastycznym powątpiewaniem: tak, tak, mamy przecież zasadę życzliwej interpretacji w KPA a inteligentne automaty w urzędach, zgodnie z tą zasada, będą się do nas pięknie uśmiechać.
Wiarygodność obliczeniowa SI, niezależnie od jej konkretnych zastosowań, jest mierzona często jej przejrzystością, umiejętnością wyjaśniania podejmowanych decyzji, zgodnością tych decyzji z przewidywaniami itd. Niemniej, naszym zdaniem, nie jest to droga, która zaprowadzi nas do takiej SI, jakiej człowiek, w szczególności obywatel, będzie ufał.
Co z tego, że system jest przejrzysty, jeśli nie bierze pod uwagę interesu i preferencji samego obywatela? Nie jest to strategia, która gwarantuje spełnienie oczekiwań UE w stosunku do SI. Dopiero uwzględnienie życzliwości (i stojących za nią rozwiązań technicznych), pozwoli na wypracowanie takiego modelu prawnego i funkcjonalnego SI w zastosowaniach publicznych, który spełni oczekiwania pokładane w wiarygodnej SI.

Życzliwość SI to nie jest uśmiech robota upodabniającego się do człowieka (taki robot zresztą, im bardziej przypomina człowieka, tym bardziej budzi jego nieufność). SI, jeśli ma być wiarygodna w zastosowaniach publicznych, to powinna być życzliwa, a to oznacza, że powinna brać pod uwagę dobro obywatela.

Zapraszamy do dyskusji – Bartłomiej Skowron i Marcin Rojszczak.

Zaszufladkowano do kategorii Etyka, Filozofia informatyki, Retoryka, Światopogląd informatyczny | 32 komentarze

Turingowskie inspiracje… czyli o myśleniu ludzi i maszyn raz jeszcze

Szanowni Państwo!

Proponuję podjąć raz jeszcze dyskusję na temat omawiany w blogu co najmniej dwukrotnie…
Polecam, na przykład, dyskusję z roku 2012, a także nieco nowszą, z roku 2019.

W obydwu rozmowach inspirowaliśmy się niezwykle ważnym dla filozofii umysłu tekstem Alana Turinga pt. „Maszyny liczące a inteligencja”. W tekście tym znajdujemy, po pierwsze, oryginalne sformułowanie testu na inteligencję maszyn, nazywanego dziś testem Turinga, po drugie jednak, szereg polemicznych uwag Turinga do wysuwanych w jego czasach argumentów na rzecz niemożności skonstruowania maszyn myślących. Są one zawarte w rozdziale 7 wzmiankowanego tekstu.

Proponuję wziąć te uwagi za punkt wyjścia blogowej dyskusji.

Czy argumenty przytaczane przez Turinga zachowały swoją aktualność? Które z nich są najsilniejsze? Które z nich Turing odpiera w sposób przekonywujący, a które opierają się jego krytyce? Czy możemy dzisiaj, z perspektywy współczesnych dokonań informatyki, wysunąć argumenty inne lub rozbudować jakoś polemikę Turinga?

Wszelkie wypowiedzi mile widziane. Również takie, które wychodzą poza dość wąską definicję myślenia jako czynności możliwej do stwierdzenia za pomocą (werbalnego i behawioralnego zarazem) testu Turinga.

Na rozgrzewkę proponuję  fragment mojego dawnego komentarza z dyskusji prowadzonej w roku 2012.

<<
Interesujący nas temat, czyli [samo myślenie] oraz [hipotetyczne myślenie maszyn], jest niezwykle trudny, ponieważ nie za bardzo potrafimy wyjaśnić jednoznacznie, a także zgodzić się co do tego, cóż to znaczy „myśleć”.
Oczywiście nie tylko my. Nad problemem tym łamią sobie głowy (i pióra) wybitni specjaliści: psychologowie, neurobiologowie, filozofowie itd…
Sam Turing, podobnie jak będący dla niego pewnego rodzaju inspiracją psychologowie-behawioryści (nie badajmy myślenia jako takiego, badajmy korelacje między bodźcami i reakcjami organizmu), próbował ten temat ominąć – próbował bowiem utożsamić myślenie z jego zewnętrznymi przejawami (taka jest w istocie intencja testu Turinga).
Dla Turinga zatem i godzących się z nim dyskutantów “myśleć” to chyba tyle co „skutecznie rozwiązywać problemy (którą to skuteczność daje się jakoś mierzyć)” .
Dla anty-turingowców z kolei „myśleć” to coś więcej, a mianowicie „przeżywać (świadomie) pewne wewnętrzne stany, jak poczucie zrozumienia czy satysfakcji z uzyskanego rozwiązania, które to stany niezwykle trudno opisać obiektywnie”.
Ci pierwsi łatwiej zapewne zgodzą się na możliwość skonstruowania myślących maszyn, ci drudzy trudniej.
Do tego wszystkiego dochodzi jeszcze jedna sprawa. Otóż za odpowiedzią pozytywną na interesujące nas pytanie („Tak. Maszyna może myśleć.”) kryje się dość często czyjeś przekonanie (i podejrzenie zarazem), że umysł ludzki jest w istocie skomplikowaną maszyną, a pozornie tylko wydaje się, że nią nie jest.
Czy nie tak właśnie – mniej lub bardziej świadomie – mniemał Alan Turing (zauważmy, że pada w tekście kilkukrotnie dziwne określenie „ludzka maszyna cyfrowa”)?
Dla osób o takim nastawieniu zupełnie naturalne wydaje się, że maszyny będą mogły kiedyś dorównać mechanicznemu (z założenia) umysłowi. A zatem będą mogły myśleć.
Osoby odpowiadające przeciwnie zakładają z kolei, że „umysł nie jest mechaniczny”, a przyczyną jego nie-mechaniczności może być np. specyficzne fizyczne tworzywo umysłu-mózgu (umysł zatem to nie tylko program, ale nadto substancja ów program implementująca) albo nie-materialna dusza jakoś sprzężona z mózgiem.
Ja proponuję, choćby na chwilę, przyjąć jeszcze inny punkt widzenia.
Otóż, być może, bardziej istotne od pytania o to “czy maszyny mogą myśleć?”, jest pytanie o to “czy maszyny pozwolą nam zrozumieć lepiej, na czym polega ludzkie myślenie?”. Być może taki właśnie najgłębszy sens – tj. chęć lepszego zrozumienia fenomenu ludzkiej myśli – ma konstruowanie i analizowanie maszyn (informatycznych) do sztucznej realizacji czynności poznawczych.
>>

Serdecznie zapraszam do swobodnej rozmowy!

Paweł Stacewicz

Zaszufladkowano do kategorii Bez kategorii, Dydaktyka logiki i filozofii, Filozofia informatyki, Filozofia nauki, Światopogląd informatyczny | 55 komentarzy

Era informacji, informatyczna, cyfrowa…
Czy te i inne „informacyjne” etykiety dobrze pasują do naszych czasów?

Obecnym wpisem chciałbym odświeżyć przedwakacyjną dyskusję pt. „Czy żyjemy w erze informacji i co to znaczy?”.  Temat wydaje się banalny, a odpowiedź oczywista: tak, żyjemy w erze informacji, a sama informacja, głównie za sprawą informatyki, ma coraz częściej postać cyfrową.

Oto próbka tekstu naukowego, w którym termin „era cyfrowa” jest traktowany jako zupełnie oczywista nazwa naszych czasów:

<< Podstawową charakterystyką ery cyfrowej jest bezprecedensowa ekspansja informacji. Począwszy od lat 80. XX wieku, wolumen zgromadzonych na świecie danych i skumulowana moc obliczeniowa podwajają się co 2–3 lata (Hilbert i Lopez, 2011). Koszt standardowej operacji obliczeniowej spada średnio o 53% rocznie (Nordhaus, 2017). Można powiedzieć, że przetwarzanie, przechowywanie i transmisja informacji odspoiły się od możliwości poznawczych ludzkiego mózgu – przed erą cyfrową to człowiek za to odpowiadał, dziś w zdecydowanej większości jest to już domeną komputerów i innych urządzeń elektronicznych. Przed 1980 r. mniej niż 1% informacji było zakodowanych w postaci cyfrowej, dziś ponad 99% (Gillings, Hilbert i Kemp, 2016).>>
Źródło:  J. Growiec, “Społeczny odbiór nauki w erze cyfrowej”, z książki Ewolucja cywilizacyjnej roli i społecznego odbioru nauki

Dyskutując powyższe kwestie kilka miesięcy temu, wiele osób wykazało zdrowy – moim zdaniem –  krytycyzm co do nazbyt pośpiesznych prób nazwania współczesności. Nazbyt pośpiesznych, bo czynionych ze zbyt bliskiej czasowej perspektywy. 
Oto kilka reprezentatywnych głosów:

1.
Uważam, że samo spojrzenie technologiczno-informatyczne może być zbyt zawężoną perspektywą spojrzenia na nasze czasy. Z pewnością jest to jeden z głównych aspektów definiujących nasze społeczeństwo, ale nie jedyny. Myślę, że nie sama informacja jest tu słowem kluczem, a bardziej jest to „globalizacja”.

2.
Czy zatem można powiedzieć, że żyjemy w erze informacji? Osobiście nie zgadzam się z tym stwierdzeniem. Aktualnie posiadamy szybszy przesył informacji, dzięki czemu możemy wykorzystać więcej zasobów, ale informacja nie zyskała większej wagi niż to było w poprzednich epokach. Moim zdaniem trafniejszym określeniem jest to, że „żyjemy w erze danych”.

3.
Nie powiedziałbym, że dzisiejsze społeczeństwo możemy nazwać „społeczeństwem informacji”, jako głównym mianem. Podobnie jak kilku moich przedmówców, nazwałbym nas prędzej „społeczeństwem dezinformacji”. Łatwość dostępu do wiedzy sprawia, że trudniej jest ją filtrować, sięgamy po najprostsze środki (wyszukiwarka Google), nie zastanawiając się, czy strona, na którą trafiliśmy jest wiarygodna. Nie mówiąc już o algorytmach, które wyświetlają nam treści zgodne z naszym światopoglądem, co prowadzi nas do mylnego wrażenia, że wszyscy na świecie myślą podobnie do nas.

4.
Chociaż wszyscy możemy się zgodzić, że komputer jest wynalazkiem definiującym w pewnym sensie nasz czas (jednak należy tutaj też uważać, ponieważ tkwimy w pewnej bańce informacyjnej środowiska informatycznego i nasza opinia może być nieobiektywna), to pozostawiłbym nazywanie obecnych czasów przyszłym pokoleniom. Może nie dostrzegamy czegoś, co było jeszcze ważniejsze dla rozwoju cywilizacji albo może robimy coś nieprawdopodobnie złego (chociażby dla środowiska) przez co zostaniemy nazwani „erą szkód”.

Potraktujmy przytoczone głosy jako sygnał wywoławczy do dalszej rozmowy…
Chociaż wybrałem głosy co najmniej wstrzemięźliwe wobec określeń typu „era informacyjna” czy „cyfrowa”, to niekoniecznie musimy te nazwy skreślać.
Argumentujmy i polemizujmy zgodnie z własnym „rozpoznaniem sytuacji”.

Serdecznie zapraszam do dyskusji – Paweł Stacewicz

Jako materiał pomocniczy proponuję następujące źródła:

♦ artykuł A. Sicińskiego: Społeczeństwo informacyjne: próba nazwania naszych czasów

♦ artykuł J. Growca: Społeczny odbiór nauki w erze cyfrowej

♦ prezentacja P Stacewicza: Informacja jako pojęcie interdyscyplinarne

Zaszufladkowano do kategorii Bez kategorii, Dydaktyka logiki i filozofii, Filozofia informatyki, Filozofia nauki, Światopogląd informatyczny | 29 komentarzy

Analog computations: continuous vs empirical

We would like to invite everyone to discuss the material  that has been presented during virtual conference Computability in Europe (5-9 July 2021).

The entire slideshow (with large sections of text from our paper draft) is available HERE.

We decided to submit it for discussion, because we are now working on a new publication devoted to analog/continuous computations, and all additional critical input, and each additional discussion will be for us very precious.

Thus, we will be grateful for any comments that may contribute both: the improvement of our text (which still is in the reviewing process), and the development of our new ideas.

To encourage you to read the whole slideshow, we put two representative (text) passages below:

Two basic (general) meanings of analogicity

When talking about analog computing, i.e. a kind of non-standard computing, there are two different (yet not necessarily separate) ways of understanding analogicity.

The first meaning, we shall call it AN-C, refers to the concept of continuity. Its essence is the generalisation (broadening) of digital methods in order to make not only discrete (especially binary) but also continuous data processing possible. On a mathematical level, these data correspond to real numbers from a certain continuum (for example, an interval of a form [0,1]), yet on a physical level – certain continuous measurable variables (for example, voltage or electric potentials).

The second meaning, we shall call it AN-E, refers to the concept of analogy. It acknowledges that analog computations are based on natural analogies and consist in the realisation of natural processes which, in the light of defined natural theory (for example physical or biological), correspond to some mathematical operations. Metaphorically speaking, if we want to perform a mathematical operation with the use of a computational system, we should find in nature its natural analogon. It is assumed that such an analogon simply exists in nature and provides the high effectiveness of computations.

In a short comment to this distinction, we would like to add that the meaning of AN-E has, on the one hand, a historical character because the techniques, called analog, which consisted in the use of specific physical processes to specific computations, were applied mainly until the 1960s. On the other hand, it looks ahead to the future – towards computations of a new type that are more and more often called natural (for example, quantum or computations that use DNA).

The meaning of AN-C, by contrast, is more related to mathematical theories of data processing (the theoretical aspect of computations) than to their physical realisations.

The categories AN-C and AN-E are not disjoint, as there are empirical computations that consist in processing continuous quantities.  As such, they are AN-E, but also fall into the AN-C category.

Empirical justification of AN-E computations

AN-E computations are closely related to the theories of empirical sciences (e.g., physics or biology). This means that specific computations of this type could neither be specified nor physically implemented without reference to a specific theory of this type.

Typically, such theories are treated as a tool for accurate description of physical reality in terms of mathematical structures and operations. Thus, their cognitive aspect is highlighted.

From the computational point of view (or more precisely: from the implementation one) they can be treated as a basis for realizing certain mathematical operations by means of physical processes described by these operations. With such an approach, a particular theory is treated as something that justifies the physical implementation of certain mathematical-algorithmic operations. It is therefore a justifying theory for a particular type of AN-E computation.

Once again, we invite everyone to discuss our slideshow — Paula Quinon & Paweł Stacewicz.

Zaszufladkowano do kategorii Bez kategorii | 2 komentarze

Między wiedzą “jak” i wiedzą “dlaczego”.
Kontekst algorytmiczny.

Jako sygnał wywoławczy kolejnej blogowej rozmowy chciałbym przywołać następujący cytat z tekstu Donalda Knutha o algorytmach:

Być może największym odkryciem będącym rezultatem wprowadzenia komputerów okaże się to, że algorytmom, jako przedmiotom badania, przysługuje niezwykłe bogactwo interesujących własności oraz to, że algorytmiczny punkt widzenia jest użytecznym sposobem organizacji wiedzy w ogólności.

Algorytmiczny punkt widzenia…
Zastosujmy go nieco węziej niż to postuluje Knuth, przyjmując, że algorytm stanowi wzorcowy (schematyczny, jednoznaczny, intersubiektywnie dostępny…) zapis wiedzy „jak”, czyli wiedzy o tym, jak rozwiązywać problemy określonego typu. Na przykład: jak znajdować pierwiastki równań kwadratowych czy diagnozować choroby układu oddechowego.
Warto napomknąć tutaj, że na polu epistemologii wiedzę „jak” odróżnia się od wiedzy „że”. Ta pierwsza ma charakter proceduralny, operacyjny, pragmatyczny (w naszym ujęciu: algorytmiczny)… ta druga zaś,  dotyczy faktów i zależności między nimi (oto przykład: Wisła jest dłuższa od Odry); ma zatem charakter deklaratywny lub opisowy.

O użyteczności algorytmów w ogólnym kontekście gromadzenia i zdobywania wiedzy dyskutowaliśmy już kilka razy, np. przy okazji wpisu Siła algorytmów czy wpisu Algorytmiczne podejście do zdobywania, zapisywania i przekazywania wiedzy….

Tym razem proponuję przyjrzeć się zagadnieniu przejrzystości poznawczej algorytmów — koncentrując się roboczo na kontekście informatycznym, a dokładniej na metodach i systemach sztucznej inteligencji (SI). Nie znaczy to oczywiście, że w dalszej rozmowie nie możemy wychodzić poza ten roboczy kontekst!

Otóż we współczesnych systemach SI, a więc systemach służących do automatyzacji czynności poznawczych człowieka (takich jak wnioskowanie czy komunikacja językowa), coraz częściej stosuje się algorytmy (samo)uczące się. Mają one status schematów pomocniczych, a więc schematów „drugiego poziomu”, które prowadzą do udoskonalenia algorytmu właściwego, odpowiedzialnego za działanie systemu.
Przykładowo: jeśli system służy do stawiania diagnoz medycznych, to algorytm właściwy mówi „jak przechodzić od obserwowanych objawów do stwierdzenia takiej a takiej choroby”, natomiast algorytm uczenia się ma na celu wcześniejsze dopasowanie pewnych parametrów algorytmu właściwego (być może nawet: utworzenie go od podstaw), tak aby ten ostatni działał poprawnie.
Dopowiedzmy koniecznie, że sporo współczesnych systemów uczących się ma postać sztucznych sieci neuronowych. W ich przypadku algorytmy uczenia się są pewnymi (inspirowanymi biologicznie) schematami samoorganizacji tych sieci – samoorganizacji, która polega na „dostrajaniu” wag połączeń międzyneuronalnych, a niekiedy też pewnych parametrów sztucznych neuronów.

Mając na uwadze rozróżnienie między algorytmami działania (jak rozwiązać problem, jak podjąć decyzję itp.) oraz algorytmami uczenia się (jak utworzyć lub udoskonalić algorytm właściwy), można postawić zagadnienie przejrzystości poznawczej tych pierwszych.
Chociaż stanowią one wiedzę „jak” i są podstawą efektywnych działań systemu, to w konkretnych przypadkach można się zastanawiać, w jakim stopniu wiedza ta ma status wiedzy „dlaczego”?
Przykładowo: wiemy, jak system stawia diagnozy i widzimy ich poprawność, nie do końca jednak rozumiemy, dlaczego są to takie właśnie diagnozy. Innymi słowy: system ma taką strukturę i taki algorytm działania (np. jest on bardzo złożony lub zawiera pewne techniczne parametry niskiego poziomu), że nie dostarcza wprost dobrych wyjaśnień podejmowanych przez siebie decyzji. Być może nawet, wyjaśnienia takie są w ogóle nieosiągalne.
Mówiąc obrazowo, system taki przypomina nieprzejrzystą poznawczo czarną skrzynkę.

Wobec zarysowanych trudności chciałbym poddać pod dyskusję następujące pytania:

Czy problem nieprzejrzystości poznawczej jest dla informatyków istotny?
Jeśli tak, to jakich systemów/algorytmów dotyczy?
Jakie czynniki ten problem wywołują i potęgują?
Czy znacie Państwo jakieś sposoby przezwyciężania tego problemu?
A może: w przypadku systemów informatycznych wiedza typu „dlaczego” jest nie do końca potrzebna, bo wystarczy skuteczna w praktyce wiedza „jak”?

Zachęcam do swobodnej rozmowy na powyższe tematy – z możliwością wykroczenia poza nie!

Na rozgrzewkę zaś przytaczam historyczny komentarz stałego bywalca Cafe Aleph, niejakiego k-ma, który dotyczył podobnych kwestii (komentarz ten delikatnie przeredagowałem):

<< Wobec współczesnych dokonań informatyki możliwa jest sytuacja, w której wiedza naukowa będzie mogła być efektywnie poszerzana przez „uczące się” automaty — korzystające ze sformalizowanych procedur tak, że plon tej zalgorytmizowanej działalności będzie racjonalny, to znaczy komunikowalny i intersubiektywnie sprawdzalny przez inne automaty korzystające z algorytmów na coraz to nowszych „jakościowo poziomach” — ALE wiedza ta nie będzie mogła się przełożyć na „wiedzę indywidualną” ludzi korzystających z owych automatów. Badacze będą mogli zyskać czasem wiedzę „że” i „jak”, ale nie wiedzę „dlaczego”. >>

Jako materiały pomocnicze do dyskusji (zob. też linki wyżej) proponuję:

tekst Donalda Knutha o roli algorytmów w informatyce
tekst Pawła Stacewicza o metodzie algorytmicznej
slajdy Pawła Stacewicza do wykładu nt, informacji i wiedzy

Serdecznie zapraszam do dyskusji – Paweł Stacewicz

Zaszufladkowano do kategorii Dydaktyka logiki i filozofii, Filozofia informatyki, Filozofia nauki, Światopogląd informatyczny, Światopogląd racjonalistyczny | 16 komentarzy

Czy żyjemy w erze informacji i co to znaczy?

Do obecnej dyskusji zapraszam przede wszystkim (choć nie tylko!) studentki i studentów wydziału WEiTI Politechniki Warszawskiej, z którymi prowadzę zajęcia z filozofii informacji.
Na kolejne zajęcia zaplanowaliśmy debatę, którą proponuję rozpocząć wstępnie, a potem kontynuować :), w blogu. Mam nadzieję, że dołączą do nas również inne osoby, w tym stali bywalcy Cafe Aleph.

Tematem debaty jest era informacyjna, a dokładniej znaczenie i zasadność stwierdzenia, że “żyjemy w erze informacji“.
Ze stwierdzeniem tym korespondują rożne inne określenia, bardzo chętnie stosowane przez kulturoznawców, socjologów i filozofów.
Oto szczególnie wyraziste przykłady: społeczeństwo informacyjne (dopełniane zwykle  przymiotnikiem: postindustrialne), społeczeństwo sieciowe (mamy tu podkreślenie roli  Internetu) czy epoka cyfryzacji (uwypuklające rolę wynalazku komputera cyfrowego i powiązanych z nim technologii).

Dlaczego jednak  informację akurat, a nie coś innego, mamy uznać za kategorię definiującą nasze czasy?

Czy przesądza o tym wszechobecność urządzeń i technologii do przetwarzania informacji?

Czy chodzi może o skuteczne zastosowania pojęcia informacji w naukach (biologii, psychologii, fizyce…), które tworzą dzięki temu pojęciu pewien nowy obraz świata?

A może idzie o to, że coraz częściej świat realny zastępuje się wirtualnym, a więc w jakimś sensie informacyjnym?

A może zmienił się dominujący wzorzec aktywności ekonomiczno-gospodarczej i niemal wszystko w tej sferze zależy dziś od pozyskiwanych i posiadanych informacji?

Proszę Państwa, potraktujmy ten katalog pytań jako sygnał wywoławczy do dyskusji, która może się potoczyć również w innych kierunkach!
Wszelkie głosy MILE widziane…

Jako materiał pomocniczy do dyskusji proponuję następujące teksty i prezentację:

♦  artykuł A. Sicińskiego Społeczeństwo informacyjne: próba nazwania naszych czasów

♦  artykuł T. Goban-Klasa Teoretycy społeczeństwa informacyjnego

♦  prezentacja z ostatniego wykładu (wzbogacona o kilka nowych slajdów)

Serdecznie ZAPRASZAM do dyskusji wszystkich Czytelników bloga — Paweł Stacewicz.

Zaszufladkowano do kategorii Dydaktyka logiki i filozofii, Filozofia informatyki, Filozofia nauki, Światopogląd informatyczny | 25 komentarzy

O pięknie pojęć i teorii naukowych

Zachęcony niezwykle interesującą wymianą myśli ze studentami Wydziału Fizyki PW zdecydowałem się wywołać w blogu dyskusję na temat piękna w nauce. Przede wszystkim w matematyce i fizyce.
Zamiast klasycznego wstępu przedstawiam niżej kilka reprezentatywnych głosów z zajęć, które były wpisywane na wykładowym czacie podczas referatu o humanistycznych aspektach fizyki. Są to oczywiście pewne wyrywkowe i spontaniczne spostrzeżenia, które możemy niżej dowolnie komentować i rozwijać. Mam nadzieję, że będą one stanowić dobry impuls do rozmowy.

1.
Dlaczego naukowcy posługują się pewną intuicją związaną dość mocno z poczuciem estetycznego piękna teorii naukowych? Dlaczego uznają niektóre z nich za piękniejsze, a tym samym warte większego zainteresowania?
Czasem piękno może oznaczać prostotę — to, że daną teorię da się sprowadzić do podstawowych form i operacji matematycznych. Czasem jednak niesamowicie przeładowana matematyką teoria może wydać się piękna właśnie dlatego, że zdołała opisać pewien nowy lub  nierozwiązany dotychczas problem. Zatem intuicja i poczucie estetyki u naukowca mogą być przydatne, by rozpoznać to, co ma potencjał do okazania się dobrą teorią. 

2.
Wydaje mi się, że piękno to pochodna biologicznego instynktu, który podpowiada nam, co jest piękne; podpowiada po to, by móc dokonać właściwego wyboru z punktu widzenia przetrwania (np. przy wyborze partnera/ki).

3.
A może piękno teorii jest wynikiem zespołu cech, które odpowiadają za “skuteczność” teorii… M. Heller w jednej ze swoich książek przytacza porównanie, jakiego użył S. Weinberg, zestawiając piękno teorii fizycznej z pięknem konia sportowego. Doświadczony trener rozpozna konia o odpowiednich cechach; już na pierwszy rzut oka potrafi wstępnie określić jego możliwości. Dobra teoria, podobnie jak koń sportowy, posiada zestaw cech, które zapewniają jej skuteczność.

4.
Czy piękno to swojego rodzaju idealność? Czy np. fuzję jądrową można nazwać pięknym źródłem energii (zero odpadów, CO2 itp.)? Podobne określenie możemy zastosować do teorii fizycznej, która wydaje się być idealna… W sumie to dość sensowna definicja piękna. W życiu też pięknym nazywamy, to co instynktownie uznajemy za idealne.

5.
Według mnie mieszanie piękna i prawdy jest błędne i nie powinno się na gruncie naukowym dyskutować o tym, czy jakaś nauka jest piękna, czy brzydka, bo prawda jest obiektywna, a wrażenia estetyczne – subiektywne.

A zatem: na czym miałoby polegać piękno zmatematyzowanej teorii naukowej? Na jej prostocie, symetrii, wewnętrznym uporządkowaniu, idealności…? Czy kryteria tego rodzaju  można precyzyjnie sformułować, nie uciekając się do „miękkich” porównań i metafor?

Serdecznie zapraszam do rozmowy – Paweł Stacewicz.

Zaszufladkowano do kategorii Dydaktyka logiki i filozofii, Filozofia nauki, Światopogląd racjonalistyczny | 16 komentarzy

Racjonalistyczny optymizm Hilberta, Gödla, Turinga

Obecny wpis jest moim głosem w dyskusji na międzyuczelnianym (IFiS PAN, IF UW, środowisko filozoficzne PW) posiedzeniu seminarium pt. “Ku filozofii informatycznej”, 17.XI.2020.  Dwa główne na tym posiedzeniu odczyty, profesorów Pawła Polaka (“Filozofia informatyki, o jakiej nie śniło się  informatykom”)  i Kazimierza Trzęsickiego (“Filozofia informatyczna i paradygmat Turinga”), mają pewien wspólny wątek — pankomputacjonizm, do którego chciałbym się odnieść w tych uwagach jako do szczególnie wyrazistej gałęzi filozofii informatycznej. Dobre tło dla tych uwag stanowi wprowadzenie do seminarium, autorstwa doktora Pawła Stacewicza.

§1. Anty-limitatywne  twierdzenie Gödla, 1936, ilustrujące epistemiczny pankomputacjonizm jako gałąź filozofii informatycznej.

Posługując się terminem “pankomputacjonizm epistemiczny” należy wyjaśnić, od jakiego innego kierunku ma go odróżniać ten przymiotnik.  Rzecz jest warta pilnej uwagi, bowiem ów inny kierunek jest rozległymi frapującym działem filozofii informatycznej.  Proponuje określać go mianem pankomputacjonizm ontyczny, wkracza on bowiem w kwestię natury bytu glosząc myśl że podstawowym tworzywem świata nie są elementarne cząstki materii lecz bity czyli elementarne cząstki informacji.  Wyraża tę myśl maksyma Johna Wheelera it from bit (można to oddać jako “byt z bitów”).  Cała rzeczywistość jest według tej koncepcji gigantycznym komputerem cyfrowym przetwarzającym bity wedle algorytmu kierującego ewolucją wszechświata.

Jakkolwiek fantastycznie brzmi ta koncepcja, zasługuje ona na uwagę, skoro opowiada się za nią grupa tak wybitnych fizyków kwantowych i  kosmologów, jak  omawiany w odczycie prof. Trzęsickiego Konrad Zuse,  wspomniany wyżej John Wheeler, a także Stephen Wolfram, Ed Fredkin, Frank Tipler i inni.

Uznawszy, że skierowanie do tekstu Trzęsickiego pozwala wspomnieć w paru tylko słowach  komputacjonizm ontyczny,  przechodzę do kwestii pankomputacjonizmu w wersji epistemicznej.  Oto doniosłe stwierdzenie Gödla, dobrze się nadające na drogowskaz ku tej części filozofii informatycznej, jaką jest epistemiczny pankomputacjonizm.

Der Übergang zur Logik der nächst höheren Stufe bewirkt also nicht bloß, daß gewisse früher unbeweisbare Sätze beweisbar zu werden, sondern auch daß  unendlich viele der schon vorhandenen Beweise außerordentlich stark abgekürzt werden können. — “Über die Lange von Beweisen”

Powiada w tym ustępie Gödel, że przejście do wyższego rzędu logiki powoduje nie tylko to, że dadzą się dowieść pewne twierdzenia dotąd niedowodliwe, lecz także to, że nieskończenie wiele już istniejących dowodów ulega nadzwyczajnemu skróceniu.  Ciekawą tego egzemplifikacją w praktyce matematycznej jest w aksjomatyce Peano przejście od aksjomatu indukcji pierwszego rzędu do sformułowania w logice drugiego rzędu.

Dowód w rozumieniu tak Gödla jak  iHilberta jest to dowód sformalizowany, a więc wykonalny  lub sprawdzalny dla maszyny cyfrowej. Znaczy to, że każdy problem matematyczny da się rozwiązać algorytmicznie czyli obliczeniowo. W tym sensie ów pogląd Gödla zasługuje na określenie pankomputacjonizm, a przydawka epistemiczy odróżnia go od ontycznego.

Algorytmiczne rozwiązywanie kolejnych  problemów poprzez wspinanie się na coraz wyższe rzędy logiki  jest wymowną  ilustrację fenomenu poznawczego, jakim jest twórcza konceptualizacja poprzez postulaty znaczeniowe (meaning postulates w sensie Carnapa 1947 ).  Szczególnie ważnym ważnym dla postępu nauki środkiem są  aksjomaty w teoriach sformalizowanych.  Zachodzi to także w rozważanym przykładzie Gödla ponieważ każdy nowy rząd logiki jest określany przez swoiste dlań aksjomaty.

Tenże przypadek, ujawniając dobitnie doniosła i niezbywalną rolę filozofii w informatyce, harmonizuje z  wypowiedzią prof.Polaka, że “filozofia okazuje się dla przyszłości informatyki równie ważna co umiejętności techniczne i ścisła wiedza”. Istotnie, żeby informatyka  była zdolna do algorytmicznego rozwiązywania problemów w tak wydajny sposób, musi przyjąć ontologię platońską w sensie istnienia uniwersaliów pojętych jako  zbiory w sensie teorii mnogości.  Antyplatońska filozofia nominalizmu, np. reizm Kotarbińskiego, jest w tym względzie bezradna.

Twórcza konceptualizacja czyli inwencja pojęciowa to czynnik fundamentalny,   obecny  na każdym kroku  postępu wiedzy. Spektakularnym przykładem takiej odkrywczości jest  pojęcie zera. Poświęca mu wiele uwagi odczyt Trzęsickiego, poprzestanę więc na zauważeniu, że bez obecności tego obiektu  w świecie liczb nie byłoby nawet najprostszych algorytmów czterech działań arytmetycznych. Gdyby przyjąć filozofię, które nie dopuszcza takich bytów jak zero, nigdy byśmy się nie doczekali  maszyny Turinga.

Optymistyczny  racjonalizm Gödla buduje się na założeniu, że gdy do rozwiązania jakiegoś problemu  brak nam algorytmu, to należycie usilna praca inwencji pojęciowej doprowadzi do znalezienia pojęć, które po sprecyzowaniu  przez aksjomatyzację oraz sformalizowaniu teorii aksjomatycznej  dostarczy potrzebnego algorytmu.

§.2. Racjonalistyczny optymizm Gödla  a stanowiska Hilberta  i Turinga

§2.1.  Moje propozycje w tej kwestii znajdują się m.in.  w następujących artykułach, dostępnych w elektronicznych wersjach periodyków i w bazach danych po wklejeniu w wyszukiwarce całego tytułu.

Does Science Progress towards Ever Higher Solvability through Feedbacks between Insights and Routines?Studia Semiotyczne“, tom 32 nr 2, 2018. Odcinki 1.4,  2.2, 3.1,  3.2, 5.1, 5.2.

Jako komentarz do zwrotu Feedbacks between Insights and Routines  niech posłużą dwie wypowiedzi koryfeuszy informatyki.  Pierwsza pochodzi od Gregory Chaitina, druga od Donalda Knutha. Chaitin wyjaśnia, co nas upoważnia do epistemicznego pankomputacjonizmu  w matematyce pomimo Gödlowskiego dowodu jej niezupełności.

Gödel’s own belief was that in spite of his incompleteness theorem there is in fact no limit to what mathematicians can achieve by using their intuition and creativity instead of depending only on logic and the axiomatic method. He believed that any important mathematical question could eventually be settled, if necessary by adding new fundamental principles to math, that is, new axioms or postulates. Note however that this implies that the concept of mathematical truth becomes something dynamic that evolves, that changes with time, as opposed to the traditional view that mathematical truth is static and eternal. […]  In discovering and creating new mathematics, mathematicians do base themselves on intuition and inspiration, on unconscious motivations and impulses, and on their aesthetic sense, just like any creative artist would.

Z kolei, Knuth zwraca uwagę, że  osiągnięte dzięki twórczej intuicji algorytmy pomagają  tejże intuicji  docierać do  bogactwa interesujących własności obiektów matematycznych.

Być może największym  odkryciem będącym rezultatem wprowadzenia komputerów okaże się to, że algorytmom, jako przedmiotom badania, przysługuje niezwykłe bogactwo interesujących własności oraz to, że algorytmiczny punkt widzenia jest użytecznym sposobem organizacji wiedzy w ogólności.  […] ˙Najbardziej wartościowym elementem edukacji naukowej czy technicznej są służące ogólnym celom narzędzia umysłowe, które będą służyły przez całe życie.  Szacuję, że język naturalny i matematyka są najważniejszymi takimi narzędziami, a informatyka stanowi trzecie narzędzie.

Tę myśl Knutha rozwija P.Stacewicz we wpisie “Algorytmiczne podejście do zdobywania, zapisywania i przekazywania wiedzy”, który następuje po obecnym.

§2.2. Inną moją pozycją, która traktuje szerzej o zagadnieniach poruszanych w obecnym tekście jest artykuł: The progress of science from a computational point of view: the drive towards ever higher solvability – “Foundations of Computing and Decision Sciences“, Vol.44, No~1, 2019. Odcinki  3 i 4.

Tę optymistyczną myśl, że  dla każdego matematycznego problemu istnieje w  0biektywnym świecie jestestw matematycznych rozwiązujący go algorytm, do którego zdoła dotrzeć po jakimś  czasie myśl ludzka (o ile starczy na to czasu trwania cywilizacji),  analizuje wszechstronny, a  kończący się  znakiem zapytania, fragment tekstu  Pawła Stacewicza  zatytułowany “A Discussion of Marciszewski’s Optimistic Realism” w książce “Interdisciplinary Investigations into the Lvov-Warsaw School” (redakcja A.Drabarek, J.Woleński, M.Radzki), Palgrave 2019.

Zdobywamy głębszy wgląd w powyższą myśl Gödla, biorąc pod uwagę  jego odwoływanie się do fenomenologii Husserla w próbach uzasadnienia epistemicznego optymizmu. Ujawnia się wtedy  zakorzenienie tej kwestii  w metafizyce, co nie rokuje szybkiego rozwiązania. Stanowi jednak atrakcyjne wyzwanie dla badaczy, których nie odstrasza ryzyko metafizycznych spekulacji.

Zaszufladkowano do kategorii Filozofia informatyki, Filozofia nauki | 20 komentarzy