Zasoby Informacyjne Internetu

Spis treści

  1. Strona początkowa
  2. Wprowadzenie: zasoby informacyjne i Internet
  3. Wyszukanie informacji w Internecie: korzystanie z wyszukiwarek
  4. Poszukiwanie informacji w Internecie - "bramy" (gateways) i "portale" (portals)
    1. Organizacja Sieci
    2. Wyszukiwarka oraz katalog portali
    3. Na czym polega indeksacja
    4. Tematyczne "bramy" do zasobów informacyjnych
    5. Problemy dotyczące klasyfikacji
    6. Biblioteki cyfrowe czy wirtualne
    7. Dodatkowe źródła
  5. Organizacje rządowe, samorządowe i pozarządowe oraz ich serwisy WWW
  6. Ocena zasobów informacyjnych Internetu
  7. Publikowanie własnych źródeł w Internecie


Poszukiwanie informacji w Internecie - "bramy" (gateways) i "portale" (portals)


Organizacja sieci

Nie ma nikogo, kto byłby odpowiedzialny za Internet; żadna z organizacji nie reguluje jego poziomu, nie decyduje, kto powinien umieszczać informacje na serwerach, jakie standardy jakości powinny być przestrzegane. Po prostu każdy ma możliwość zainstalowania określonych danych na serwerze połączonym z Internetem.

Ostatnio w jednym z popularnych w Wielkiej Brytanii magazynów komputerowych podano np., że w pewnym wypadku serwerem był zwyczajny laptop "Libretto", podłączony do Internetu w czasie, gdy nie korzystano z niego w podróży.

Innymi słowy - wyposażenie może być naprawdę minimalne; nauczenie się zaś, jak utworzyć źródło informacji na elementarnym poziomie, nie stanowi większego problemu.

W konsekwencji więc wysoce prawdopodobnym jest, iż chaos, jaki panuje w Internecie, narastać będzie w miarę jak coraz to więcej krajów posiadać będzie mnóstwo serwerów i coraz to więcej ludzi ulegnie entuzjazmowi wynikającemu z możliwości ulokowania wszelkich informacji w Sieci.

Pojawia się w związku z powyższym konieczność odpowiedniego filtrowania danych, aby poszukujący ich sprawnie znajdował właściwe. Przekonaliśmy się już, że wyszukiwarki (search engines) próbują uszeregować wylistowane strony stosownie do poszukiwanego hasła, jednak są to przeważnie metody raczej prymitywne.

Dla przykładu proszę spróbować znaleźć jakąś stronę domową firmy, co do której macie Państwo pewność, że prezentowana jest w Internecie; następnie proszę zwrócić uwagę, która z wyszukiwarek umieściła ją na początku podanego wyniku.

Mając na względzie wieloznaczność języka oraz rozmiary Sieci można stwierdzić, iż zawsze będą występowały problemy z selekcją odpowiedniego materiału; jego zasoby zaś prawdopodobnie stawać się będą coraz większe. Alternatywą jest stworzenie biblioteki - wirtualnej, zawierającej strony z Sieci, uznane co do swej autentyczności i jakości; a więc dokonanie tego, czym na co dzień zajmują się biblioteki - skatalogowanie, uporządkowanie powyższych stron; dzięki temu odszukanie odpowiednich danych będzie znacznie łatwiejsze. "Yahoo!" było, jeśli nie pierwszym przedsięwzięciem, to z pewnością pierwszym katalogiem, swego rodzaju przewodnikiem umożliwiającym szeroki dostęp do informacji, portalem do Sieci.

Do początku stronyDo strony domowej


Wyszukiwarka i katalog

Z pewnych względów, zestawienia czy katalogi dostarczane przez wyszukiwarki, czy inne źródła danych, tak jak np. Yahoo! stały się znane jako portale, podczas gdy katalogi tworzone przez innych, szczególnie te opracowywane przez biblioteki czy w ramach projektów R&D, określa się mianem "bram informacji".

Służą one dokładnie tym samym celom i ich twórcy zapewniają o stosowaniu surowych kryteriów jakości dla umieszczenia danych w katalogu, lecz ponieważ określa się je różnie, możemy mieć z nimi do czynienia oddzielnie.

Zacznijmy od przyjrzenia się zarysowi katalogu strony domowej Yahoo! UK's

Proszę przejrzeć tę stronę i zwrócić uwagę na zastosowane tam główne kategorie, następnie zamknąć okno.

Jeśli klikniemy na "Business and Economy", zaprezentowana zostanie następująca strona z takimi oto tematycznymi nagłówkami:

Jeśli zdecydujemy, że interesuje nas "Electronic Commerce", zaprezentowana będzie kolejna lista:

Gdy natomiast zainteresuje nas "Digital Money" znajdujemy ostatecznie różne połączenia (linki) ze stronami w Sieci - w tym przypadku z pięcioma:

By wrócić do bieżącej strony - należy zamknąć okno po przejrzeniu rezultatu

Jednakże, jeśli poszukujemy tego samego pojęcia korzystając z szybkiej wyszukiwarki, otrzymujemy listę zawierającą 5.277 stron, a "Northern Light" podaje ich 436.520.

Co z kolei dzieje się, gdy owej frazy poszukujemy w Yahoo! UK ?
Jeśli pojawi się powyższa strona proszę kliknąć na "Search", a potem, by wrócić do bieżącej, zamknąć okno.

Do początku stronyDo strony domowej


Na czym polega indeksacja

Przekonajmy się o tym, przyglądając się jednemu z nagłówków na dowolnej stronie podającej rezultaty przeszukiwania przez Yahoo!

Np. co do efektu poszukiwania "Japanese Products" zauważmy, że każda pozycja uzyskana z Yahoo! posiada rodzaj tematycznego nagłówka, który pokazuje tzw. drzewo klasyfikacji odnoszące się do niej.

Proszę kliknąć poniżej, przyjrzeć się rezultatom, następnie zamknąć okno, by powrócić do bieżącej strony.

A więc jedno "wejście" to taki oto nagłówek:

Regionalne > Kraje > Japonia > Biznes i ekonomia > Firmy > Zestawienia alfabetyczne

pokazujący, w jaki sposób pozycja jest skatalogowana w pliku; jednocześnie terminowi "Japanese Products" dodatkowo towarzyszą opisy, gdzie występuje.

Wszystkie "portale" i "bramy" wykorzystują pewien typ schematu klasyfikacyjnego jak zaprezentowany powyżej; posługują się technikami, które zostały wypracowane w bibliotekarstwie w ciągu przeszło 150 lat. Niemniej, aby podkreślić, że robi się coś innego, istnieje tendencja do nazywania ich taksonomiami.

Ćwiczenia.

Proszę przyjrzeć się zestawieniom danych oferowanych przez inne wyszukiwarki, tak jak na przykład Lycos MSN Search Excite czy też Alta Vista.

Jakie podobieństwa bądź różnice zauważacie Państwo?
Czy podana klasyfikacja odpowiada przeciętnemu użytkownikowi, czy może specjaliście?
Jak poszukalibyście Waszego obszaru zainteresowań?

Zobaczycie Państwo, że portale czy katalogi proponują różne sposoby dokonywania poszukiwań; zamiast umieszczenia w wyszukiwarce terminu lub frazy, jak np. "Japanese products" (japońskie produkty), można przeglądać rozmaite poziomy schematu klasyfikacji, dopóki nie dotrzecie Państwo do zakresu Waszego zainteresowania i następnie odnajdziecie strony wartościowe z uwagi na temat poszukiwań.

Do początku stronyDo strony domowej


Tematyczne "bramy" do zasobów informacyjnych

Jak przekonaliśmy się, wyszukiwarki umożliwiają przeszukiwanie znaczącej proporcjonalnie (nie znaczy że wszystkiego) części internetowych 800 milionów stron WWW. I to użytkownik musi dokonać wyboru, co rzeczywiście jest istotne.

Zarówno tematyczne "bramy" do Internetu, tak jak "portale", dokonują dla Państwa selekcji w obrębie konkretnych dziedzin, np. medycyny, inżynierii czy nauk społecznych.

Owe "bramy" katalogują źródła, posługując się specjalistycznymi kategoriami, w związku z czym można następnie poruszać się już w obrębie określonych zasobów tematycznych.

Organizator "bramy" usiłować będzie zawrzeć tylko pozycje o podanej jakości; przy czym niektóre z "bram" publikują, jakie stosują kryteria selekcji.

Oczywiście w rezultacie "brama" wylistuje znacznie mniej pozycji niż może być zindeksowanych przez wyszukiwarkę.

Wiedząc, że jakość materiałów dostępnych w Sieci jest bardzo różna, powinniśmy zastanowić się, skąd można wiedzieć, że "brama" posiada uznawaną wartość. W tym przypadku w zasadzie odpowiedź zależy od reputacji oraz autorytetu organizacji opracowującej materiały. Stąd też szukamy profesjonalnych, naukowych stowarzyszeń, bibliotek uniwersyteckich oraz innych, zaangażowanych w opracowywanie przewodników po źródłach internetowych (obejmujących nie tylko strony Sieci), mających na uwadze przyniesienie bezpośrednich korzyści ich członkom i ogólnie - społeczności naukowej.

Komercyjne organizacje także tworzą owe "bramy"; przy czym powinniśmy dokładnie wiedzieć, jakie są relacje pomiędzy nimi a miejscami w Sieci, których selekcji dokonują; szczególnie, jeśli dana firma otrzymuje profity z reklam. Ogólnie jednakże "brama" będzie przyciągać użytkowników, skoro tylko spełniać będzie wszelkie kryteria jakości, o których wspomniane zostało wcześniej.

Informacyjne "bramy" można podzielić na 3 zasadnicze typy:

ogólne - które, podobnie jak portale wyszukiwarek, próbują zawrzeć określoną dziedzinę wiedzy lub przynajmniej część znajdującą się na stronach Sieci;

tematyczne - tak jak np. OMNI, dotycząca medycyny i opieki zdrowotnej;

narodowe albo regionalne - jak np. Fińska Biblioteka Wirtualna (the Finnish Virtual Library).

Jednocześnie proszę zauważyć, że określenia "biblioteka cyfrowa" (digital library) oraz "biblioteka wirtualna" (virtual library) bywają często używane niewłaściwie dla oznaczenia ni mniej ni więcej tylko właśnie "bramy".

Co do informacji związanych z regionalnymi czy lokalnymi władzami, można się spodziewać, że użytkownicy Internetu poszukiwać będą wiadomości różnego typu, w zależności od zakresu funkcji sprawowanych przez określony organ rządzący. Typowym jest jednak możliwość wyszukania danych na temat zróżnicowanego stopnia odpowiedzialności za planowanie urbanistyczne, budownictwo mieszkaniowe, opiekę społeczną, zdrowotną edukację, transport, policję, straż pożarną, itd. I mimo że nie zawsze można będzie znaleźć "bramę", która dotyczyłaby bezpośrednio powyższej tematyki, w rozmaitych częściach świata są obecnie dostępne wystarczające "wejścia", dostarczające ewentualnych uzupełnień znalezionej wcześniej informacji, bez konieczności korzystania z wyszukiwarki (w zasadzie dotyczy to każdego tematu).

Aby się o tym przekonać, poszukajmy tematycznej bramy, związanej z projektowaniem przestrzennym. Proszę to przećwiczyć w Google:

Czy pamiętacie Państwo, by użyć cudzysłowu, podając pytanie? Proszę nacisnąć CLICK i zobaczyć, co się stanie, następnie zamknąć okno i powrócić do bieżącej lekcji

Czy próbowaliście Państwo skorzystać z GoogleScout? Podaje on listę połączeń z "linkiem", z którego korzystacie aktualnie i jaki może być użyteczny dla odszukania bardziej szczegółowych, odpowiednich miejsc w Sieci.

Prawdopodobnie ostatnie poszukiwanie doprowadzi Państwa do wniosku, że istnieją setki miejsc, co do których można by zastosować określenie "bramy' i oczywiście niemożliwym jest przedyskutowanie ich wszystkich. Utworzyłem więc listę, jaka umożliwi przeanalizowanie kilku ważniejszych, byście mogli Państwo zidentyfikować ewentualnie istotne dla Was. Przy czym proszę pamiętać o możliwości znalezienia większej liczby informacji za sprawą użycia wyszukiwarki.

Do początku stronyDo strony domowej


Problemy dotyczące klasyfikacji

Dla dokonujących klasyfikacji istnieje powszechny problem związany z "portalami" oraz "bramami", tzn. czy zostały one utworzone przez komercyjne organizacje, jak np. Yahoo!, przez uniwersytety bądź inne niedochodowe jednostki. Uzmysławia to zarazem, że dana informacja może być rozpatrywana z różnych punktów widzenia. Na przykład strona z Sieci, dotycząca afrykańskiej gry o nazwie Mancala (lub Kalaha) może zostać zaklasyfikowana do "gier", "etnologii" lub też do dziedziny "afrykański folklor" albo do dwu bardziej zasadniczych. (W rzeczywistości zaś wspomniana strona znalazła się w miejscu poświęconym "etnograficznej matematyce"!)

Jeśli klasyfikujemy książkę, jaka ma się znaleźć się na półce, wszystko, co możemy zrobić, to umieścić ją w określonym miejscu. Gdy natomiast tworzymy katalog stron internetowych, to przy określonej stronie w zasadzie musimy umieścić odsyłacz do możliwie wielu właściwych kategorii. A to oznacza, że największym zadaniem opracowującego katalog jest dbanie o to, by zestaw danych zawsze był aktualny, łącznie z połączeniami (linkami). Nawet jeśli sprawdzanie tego typu odbywa się za sprawą specjalnego narzędzia programowego (tzw. pająka), ludzka interwencja mimo wszystko jest niezbędna, by ewentualnie zmienić lub usunąć konkretny link.

Kolejnym problemem jest fakt, że struktury klasyfikacji zmieniają się z biegiem czasu, podobnie jak relacje między tematami oraz terminologia. By przekonać się, do jakiego stopnia zmienia się ta ostatnia, możemy choćby przyjrzeć się bibliotecznej liście nagłówków tematycznych, np. opracowanej przez Bibliotekę Kongresu. Z powodu ogromu prac związanych z utrzymaniem całej listy oraz zależnościami pomiędzy terminami znajdziemy tam wiele przestarzałych rozwiązań. Jeśli więc tego rodzaju zestawienia nie są konsekwentnie rewidowane, szybko stają się nieaktualne.

Struktury klasyfikacyjne mogą ulegać powolniejszym przeobrażeniom, lecz i one powinny być monitorowane.

Ostatnia kwestia to taka, że sposób klasyfikacji w pewnym sensie jest wypadkową indywidualnych zadań oraz zainteresowań zajmujących się nią osób. Żaden ze schematów klasyfikacyjnych nie będzie odpowiadał każdemu z poszukujących informacji, ponieważ każdy posiada określony, nieco inny zasób wiedzy. W efekcie więc struktury klasyfikacyjne dostarczające wielu dróg w obszarze możliwych rozwiązań są najbardziej użyteczne.

Do początku stronyDo strony domowej


Biblioteki cyfrowe czy wirtualne

Zapewne zauważyli Państwo, że niektóre "bramy" czy "portale" określane są jako biblioteki wirtualne lub cyfrowe. W pewnym sensie rzeczywiście one bibliotekami Sieci. W ściślejszym jednak znaczeniu tak nie jest, ponieważ nie wszystkie spośród internetowych stron są pełnymi dokumentami, jak np. książki czy wszelkie sprawozdania. Najczęściej są one po prostu kolejnymi przewodnikami do źródeł informacji. Jednakże Afrykańska Biblioteka Cyfrowa (the African Digital Library On-Line) w pełnym słowa znaczeniu jest biblioteką cyfrową, gdyż zawiera (a przynajmniej taki ma cel) pełne teksty książek.

Jak podaje się do publicznej wiadomości:

"Mieszkańcy każdego z afrykańskich krajów mający dostęp do serwera z afrykańską domeną mają możliwość dostępu do biblioteki poprzez następujący adres: http://www.AfricaEducation.org/adl/

Serwery z sufixem ".com", które nie mogą zostać zidentyfikowane jako afrykańskie, powinny być dostarczane, łącznie z adresem IP, przez Dyrekcję Centrum Nauczania Ustawicznego, by serwis stał się dostępny bez opłat także w przypadku subskrybentów. Wówczas to użytkownicy mogliby otwierać konta biblioteki internetowej za darmo".

Jest to więc źródło, jakie służyć ma przezwyciężeniu problemów związanych z dostępem do książek na zdecydowanie ubogim afrykańskim kontynencie. Obecnie wspomniana biblioteka zawiera jedynie 3000 książek; jednakże za sprawą sponsorów można mieć nadzieje na jej szybkie poszerzenie. [Oto link do tego serwisu.]

Mamy więc okazję przekonać się na większą skalę, co aktualnie jest możliwe w przypadku każdej organizacji pragnącej stworzyć dostęp do własnej dokumentacji, raportów, wszelkiego rodzaju podręczników, czy jakichkolwiek materiałów potrzebnych zatrudnionym w niej ludziom.

Biblioteka cyfrowa obejmująca tego rodzaju dane jest dostępna poprzez stworzenie tzw. "intranetu' i przygotowanie niezbędnych "bram" tematycznych oraz wyszukiwarek dla umożliwienia dostępu do niej.

Do początku stronyDo strony domowej


Dodatkowe źródła

Dempsey, Lorcan ROADS to Desire: some UK and other European metadata and resource discovery projects. D-Lib Magazine, July/August 1996.

"...opisuje część ostatnich inicjatyw badawczych związanych z Programem Bibliotek Elektronicznych w Wielkiej Brytanii (Electronic Libraries Programme - eLib) oraz IV Programem Ramowym Komisji Europejskiej (Fourth Framework Programme). Szczególnie dotyczy jakości, merytorycznych podstaw "bram" informacyjnych w zakresie eLib, projektu ROADS, jaki je wspiera, a także zakrojonego na wielką skalę europejskiego projekt Desire. Wspomniane przedsięwzięcia prezentują wspólne im wszystkim elementy.

Dokonanie pewnego rodzaju analizy pozwala umieścić powyższy rozwój w szerszej nieco perspektywie ewolucji usług dotyczących opracowywania danych i jednocześnie zauważyć trendy oraz potencjalne możliwości dalszych zmian".

DESIRE Information Gateways Handbook. Bristol: DESIRE project, 1999.

Podręcznik ten przeznaczony jest dla wspierania bibliotek oraz innych organizacji zainteresowanych umieszczaniem informacji w Internecie na wielką skalę.
Krok po kroku oferuje wskazówki, jak korzystać z odpowiednich narzędzi, przykładów oraz dokumentacji, które to mogą wspierać ów proces.

Kirriemuir, J. Cross-searching subject gateways: the query routing and forward knowledge approach. D-Lib Magazine, January 1998.

"Bramy" tematyczne znane są także jako SBIGs (skrót od angielskiego "subject-based information gateways"), tematyczne indeksy, biblioteki wirtualne, drzewa tematyczne i inne tego rodzaju. Wspomniany artykuł opisuje cechy charakterystyczne niektórych "bram" tematycznych dostępnych w Sieci oraz porównuje je z wyszukiwarkami typu "automatyczny odkurzacz", jak np. AltaVista. Aplikacja WHOIS++, centroidy, droga poszukiwania informacji i uprzednia wiedza dla badania kilku z tych tematycznych "bram" równocześnie zostały w zasadzie zarysowane. W podsumowaniu publikacji wspomina się o pewnych kwestiach związanych z rozwojem "bram" tematycznych w najbliższej przyszłości. Jednocześnie poruszonych jest kilka innych, o jakich mowa we wcześniej przytoczonym

"D-Lib Magazine", szczególnie dotyczących inicjatyw oraz usług wokół źródeł informacji".

Olson, Nancy B. Cataloging Internet resources: a manual and practical guide. 2nd ed. Dublin, OH: OCLC, 1997.

"Katalogowanie źródeł informacyjnych, jakie początkowo pojawiło się jako pragmatyczna odpowiedź na potrzebę uporządkowania zasobów elektronicznych, obecnie odbywa się równolegle ze wzrostem liczby źródeł o podobnym przeznaczeniu. Nawiązując do pierwszego wydania, drugie łączy dyskusję na temat anglo-amerykańskich zasad katalogowania (AACR - Anglo-American Cataloguing Rules), drugiej edycji tych zasad oraz pól opisu bibliograficznego USMARC. Znaczące zmiany obejmują włączenie rozwiniętej listy terminów ISBD(ER), jaka ma być zastosowana w połączeniu z plikiem "Characteristics Area" i zarazem uaktualnionych przykładów odzwierciedlających szerszy zakres różnych typów źródeł." (Przedmowa)

ROADS cataloguing guidelines. Bath: UKOLN, 1999.

Specjalistyczny podręcznik na temat katalogowania przez "bramy" zasobów internetowych .

Smith, Alastair G. Search features of digital libraries Information Research, 5 (3) April 2000

Przegląd badawczych możliwości wielu bibliotek cyfrowych w zakresie różnych dziedzin.

Do początku stronyDo strony domowej


Kurs przygotowany i przeprowadzony przez Profesora Toma Wilsona z Wydziału Studiów Informacyjnych Uniwersytetu w Shefffield w ramach projektu Tempus realizowanego we współpracy z Międzynarodowym Centrum Zarządzania Informacją UMK w Toruniu oraz Wydziałem Bibliotekoznawstwa i Studiów Informacyjnych University College w Dublinie.
Data ostatniej modyfikacji: 28 kwiecień 2000