Sabtu, 19 Mei 2012

situs yang menyediakan fasilitas search untuk pencarian data

Macam-macam Search Engine dan sepesifikasinya

Search engine adalah situs yang sering kita kunjungi.Saat kita ingin mencari suatu informasi kita pasti mengunjungi search engine.Search Engine atau situs mesin pencari yang paling dikenal saat ini adalah om Google.Tapi selain itu masih banyak lagi search engine yang ada di dunia.Saya akan menjelaskan beberapa diantaranya beserta keunggulannya.

Yahoo!
(www.yahoo.com)


  Salah satu portal terbesar di Internet, selain MSN., dan juga salah satu mesin pencaru tertua. Halaman utamanya sendiri tidak terlalu ramah untuk pencarian, tetapi Yahoo! menyediakan search.yahoo.com untuk itu. Yahoo! menggunakan jasa Google untuk mencari informasi di web, ditambah dengan informasi dari databasenya sendiri. Kelebihan Yahoo! adalah direktorinya. Yahoo! juga menyediakan pencarian yellow pages dan peta, yang masih terbatas pada Amerika Serikat. Yahoo juga menyediakan pencarian gambar.  berikut ini kelebihan dan kekurangannya yang lebih jelas : 

  • Kelebihan:
1. carta surat menyurat modern untuk membuat orang menjadi lebih maju
2. salah satu web yang menyediakan layanan fasilitas gratis
3. salah satunyapun yang anda bilang, bila di refresh cepat
4. banyak fasilitas yang disediakan, seperti: Y!A Y!A Y! mail Y! 360 dan lain2
5. sudah ada di banyak negara
  • Kekurangan:
1. Satu id yahoo hanya untuk yahoo, tak bisa untuk produk windows, seperti IM dan msn
2. Teralu mudah untuk membuat id, sehingga kadang-kadang disalah gunakan
3. Fitur Y!M msh sangat kalah jauh dengan IM keluaran windows
4. Skin untuk Y!M msh sangatlah simple, tak seperti IM yang ada cukup banyak

Alltheweb
(www.alltheweb.com





  Keunggulan Alltheweb adalah pencarian file pada FTP Server. Tidak seperti web, FTP adalah teknologi internet yang ditujukan untuk menyimpan dan mendistribusikan file, biasanya program, audio atau video. Web sebenarnya lebih ditujukan untuk teks. Sejauh ini, hanya AllTheWeb yang menyediakan jasa pencarian file.  

  • Kelebihan
  1. Kemudahan dalam mencari.
  2. Tampilan yang sederhana seperti Google.
  3. Alltheweb langsung menyediakan fungsi untuk pencarian berita, musik, gambar, dan video.
  4. Menu bantuan terlihat jelas, dan di dalamnya tersedia sejumlah opsi bantuan yang banyak, sehingga sekali lagi kemudahan tampak bagi si pengguna.
  • Kekurangan
  1. Pencarian yang lama dibandingkan dengan mesin pencari lainnya.
  2. Halaman pencarian hanya dibatasi dengan sebuah garis sehingga membingungkan si pengguna.
  3. Pada link-link yang tidak berguna terkadang masih terlihat dalam beberapa hari, sehingga terlihat kurang aktual. Hal ini menunjukan tidak cepatnya Allltheweb melakukan update.

MSN
(http://search.msn.com





  Mesin pencari dari Microsoft Network ini menawarkan pencarian baik dengan kata kunci maupun dari direktori. Pemakai Internet Explorer kemungkinan besar sudah pernah menggunakan mesin pencari ini. Situs Searchenginewatch mencatat MSN sebagai mesin pencari ketiga populer setelah Google dan Yahoo! Tak ada pencarian image, atau news. Menyediakan pencarian peta, yellow pages, white pages, pencarian pekerjaan, rumah. 



  • Kelebihan
  1. mampu mencari video, musik, gambar, dan beragam format file spesial.
  • Kekurangan
  1. pencarian. Dibutuhkan waktu yang lama sampai hasil ditampilkan di halaman MSN.
  2. Pengguna juga sulit membedakan antara iklan dan bukan iklan pada halaman pencariannya. Penampilan iklan hanya dibedakan dari hasil asli melalui sebuah titik di depannya.

AskJeeves
(http://www.ask.com)



   Situs mesin pencari yang satu ini mengunggulkan kemampuannya untuk memahami bahasa manusia. Pengguna bisa menggunakan kalimat lengkap, bukan kata kunci. Situs ini berguna untuk mengetahui jawaban dari pertanyaan(misal: when did world war II end?)





  • Kelebihan
1. Keunggulan utamanya adalah ia akan mencari situs penyedia jawaban untuk pertanyaan anda.


Google
 (www.google.com)  


   Selain pencarian web, Google juga menyediakan jasa pencarian gambar, pencarian ?berita serta pencarian pada arsip USENET (newsgroup), serta direktori, seperti Yahoo! Kelemahannya terletak pada tidak tersedianya pencarian file, video, dan audio. Keunggulan Google terutama adalah pada pencarian teks, terutama dari algoritma PageRank, database-nya yang besar serta banyaknya jenis file yang diindeksnya.

  • Kelebihan
  1. Kecepatan dan kemudahan dalam mencari.
  2. lebih canggih dengan fitur yang dimilikinya.
  3. Tampilan yang sederhana.
  4. Google merupakan satu-satunya mesin pencari yang memilki cach. Dengan adanya cache ini, si pencari dapat menghemat waktu pencarian, karena hasil pencarian yang akan ditampilkan.
  5. Dapat mencari segala informasi seperti gambar, berita artikel, hiburan dll.
  • Kekurangan
  1. Dengan kelebihan yang dimilikinya, ternyata mesin pencari ini jadi bidikan para spamer untuk menampilkan iklan-iklan yang tidak diperlukan. Mereka memanfaatkan setiap celah yang ada pada sistem algoritma Google untuk memaksa iklan mereka tampil pada halaman terdepan. Maka, pencarian pun terasa tergangggu.
AltaVista
(www.altavista.com)



   Satu saat, AltaVista pernah menjadi mesin pencari terbesar. Saat ini, selain Alltheweb, Altavista juga menawarkan pencarian audio dan video. Keunggulan AltaVista adalah pilihan pencarian yang paling lengkap di antara semua mesin pencari.


  • Kelebihan
  1. keunggulan dalam hal pencarian halaman web, video, gambar, MP3, dan file audio lainnya. Dalam pencarian berita pun Altavista mampu mencari berita teraktual.
  2. Altavista mampu menetapkan berapa umur maksimal yang akan ditampilkan.
  • Kekurangan
  1. Dalam hal pencarian data yang kurang bagus. Sering kali mesin pencari ini menampilkan hasil yang sama sekali tidak ada kaitannya dengan tema yang dicari.

Lycos
(http://www.lycos.com)



  Salah satu mesin pencari tertua. Saat ini Lycos lebih dikenal sebagai portal, sehingga fungsi pencarinya tidak terlalu menonjol. Lycos, selain mendukung pencarian web, juga menyediakan pencarian file MP3, dan video pada http://multimedia.lycos.com. 

  • Kelebihan
1. Lycos mampu mencari data dengan cepat dan ini merupakan kelebihannya.
2. Dalam hal pencarian cepat.
3. Lycos menyediakan fungsi “Fun Search” yang lebih diperuntukkan bagi kalangan remaja. Ini sangat membantu bagi kalangan yang membutuhkan gosip dan lagu terbaru dari para selebritis pujaan.
4. Lycos juga menampilkan 50 pencarian terbesar di halaman depannya.
  • Kekurangan
  1. Untuk mencari berita-berita aktualnya, pengguna harus masuk ke bagian site map karena berita-berita tersebut tidak ditampilkan di halaman depan.
  2. Sering tidak spesifik karena datanya kebanyakan masih mengambil data dari mesin pencari Alltheweb yang tergolong paling lamban dalam pencarian data

SEARCH ENGINES REVIEW
Untuk mendapatkan informasi secara cepat dan akurat melalui halaman internet, saat ini telah dikembang- kan mesin pencari (search engines) yang dapat membantu didalam penelusuran artikel, file, maupun database. Ada banyak pilihan search engines yang bisa dimanfaatkan dan masing-masing memiliki keistimewaan.
Namun pada prinsipnya semua mesin pencari (search engines) mempunyai fungsi sama yaitu mencari serta menganalisis semua halaman WEB, kemudian membuat indeks kata bersama dengan daftar URL , halaman dan tempat dimana “kata kunci” yang dicari dapat ditemukan.
Adapun beberapa search engines yang populer dan sering dimanfaatkan antara lain.



Deja News http://www.dejanews.com/
Deja News memiliki kekhususan sebagai search engine untuk mencari berita-berita diskusi dengan fasilitas “deja discussion”, rating product dengan fasilitas “deja rating” dan fasilitas “deja communities” dengan data dari usenet, newsgroup maupun posting yang dikirim melalui web.
Search engine ini sangat membantu bagi yang membutuhkan mencari informasi yang sangat spesifik . Keunggulan lain adalah kemampuannya memberikan informasi yang cukup detil tentang “news reading” dan
posting-posting yang dikirim lewat WEB.


Excite http://www.excite.com/
Keistimewaan Excite adalah pilihan menu yang ditawarkan cukup lengkap dengan sistem indeks yang cukup baik. Excite merupakan search engine yang cukup baik untuk mengetahui berita-berita terbaru dari beberapa sumber seperti Reuters dengan menu barunya yang disebut “Today on Excite” walaupun tidak tergolong excellent. Search engine ini baik bagi pemula karena fasilitas pencariannya yang mudah dan sederhana. Selain itu, excite juga dilengkapi dengan fasilitas “chatting”, “business news”, “sport news” dan lain-lain.

Hotbot http://www.hotbot.com/
Dikenal sebagai salah satu sarana pencarian paling cepat dengan dukungan data puluhan juta websites yang dapat diakses melalui kata kunci atau frase kunci dengan operator boolean untuk mendapatkan data yang spesifik.
Di “advanced search”, HotBot menyediakan fasilitas pencarian dokumen yang lebih spesifik lagi dengan batasan waktu, lokasi, domain, bahasa, “word filter”, dan media ( gambar, teks, suara dll.) dengan klik saja atau menuliskannya pada “search boxes”. Keistimewaan yang lain, hotbot merupakan search engine yang dikategorikan “excellent” untuk berita-berita terbaru dengan menu “news headline”nya. Menu yang lain yang terdapat di hotbot adalah “discussion group”, white pages, yellow pages, dan lain-lain.

Magellan http://magellan.excite.com/
Selain menyediakan sarana pencarian melalui WEB,Magellan juga mempunyai aturan untuk tidak memuat semua data yang bersifat “Adult content”. Semua hasil pencarian dapat di browse menurut topik dan sub-topik dan bila menghendaki review untuk site-site yang dicari dapat dipilih menu “green light site” yang juga dengan memberikan ranking data.

Northern Light http://www.northernlight.com/
Northern Light merupakan salah satu search engines yang mampu menjelajah dunia WEB dengan detil dengan jumlah 150 juta websites. Keistimewaan lain adalah adanya alternatif informasi melalui “special collection” yang menyediakan 8 juta artikel dari 5.400 journal, buku, majalah dan database yang dapat diperoleh dengan harga rata $1 – $4 / artikel. Karena itu site ini sangat membantu untuk pencarian informasi khususnya bagi kalangan akademis dengan harga yang relatif murah.


Infoseek http://www.infoseek.com
Infoseek dikategorikan sebagai salah satu search engine yang dikategorikan baik untuk mengetahui berita – berita terbaru dari “Businesswire”, Reuters, CNN, USA Today dan The New York Times. Selain itu, infoseek juga memiliki kelebihan direktori yang disusun dengan sistem index yang baik dengan topik-topik yang cukup besar, dibandingkan dengan Yahoo dan HotBot. Infoseek juga memberikan ranking data hasil pencarian sesuai dengan tingkat kebenarannya.

 Searching merupakan suatu proses pencarian data dari sejumlah data yang ada. Pencarian data dapat dilakukan pada sejumlah data yang sudah terurut atau juga pada data yang sama sekali belum terurut. Kita mencoba menggunakan dua metode pencarian yaitu :
- Pencarian Berurutan (Sequential Searching).
- Pencarian Biner (Binary Seacrh).

Pencarian Berurutan (Sequential Searching)
Metode ini merupakan metode paling sederhana, secara garis besar metode ini bisa dijelaskan sebagai berikut. Dari data yang diketahui, data yang dicari dibandingkan satu per satu sampai data tersebut ditemukan atau tidak ditemukan. Pada saat data yang dicari sudah ditemukan, maka proses pencarian langsung dihentikan. Tetapi jika belum ditemukan, maka pencarian diteruskan sampai seluruh data dibandingkan. Dalam kasus paling buruk, untuk data dengan N elemen harus dilakukan pencarian sebanyak N kali pula. Ada baiknya jika data
yang dicari tidak ditemukan maka data ditambahkan pada posisi terakhir.

Metode Pencarian Biner (Binary Search)
Metode ini digunakan jika sejumlah data telah diurutkan. Jika dibandingkan dengan metode awal tadi metode ini jauh lebih cepat. Secara garis besar metode ini bisa dijelaskan sebagai berikut. Urutkan dahulu sejumlah data. Lalu bagi dua data-data tadi dengan jumlah data yang sama pada masing-masingnya. Kemudian data dibandingkan dengan data terakhir dari subdata yang pertama. Jika data yang dicari lebih keci, pencarian dilanjutkan pada sub data pertama dengan terlebih dahulu membagi dua lagi data-data tersebut dengan jumlah yang sama. Tetapi jika data yang dicari lebih besar dari data terakhir subdata pertama, berarti data yang dicari kemungkinan terletak pada subdata yang kedua. Proses diatas dilakukan berulang sampai data ditemukan atau tidak ditemukan.

Searching Dalam Dunia Web
Searching juga berarti pencarian suatu situs yang belum kita ketahui secara pasti alamat yang dimiliki. Dalam melakukan searching biasanya kita gunakan search engine sebagai mesin pembantu dalam pencarian situs tersebut. Search engine adalah sebuah fasilitas (web) yang bisa mencari links dari situs lain. Ada berbagai macam search engine yang bisa kita gunakan dalam searcing, yaitu; yahoo, google, altavista, lycos, astaga, msn, dan lain sebagainya. Disini akan dijelaskan bagaimana cara searcing melalui beberapa search engine yang pada umumnya dipakai yaitu dengan menggunakan google dan yahoo.

Search Engine
Search engine “SE” adalah suatu portal website yang menyediakan data-data yang dibutuhkan pengguna internet. untuk mendapatkan hasil yang di inginkan pengunjung internet harus mengetikkan kata atau yang biasa disebut “keyword” kedalam search engine tersebut. siapa portal website yang menyediakan fasilitas search engine ? saat ini yang paling terkenal adalah google.com, yahoo.com, msn.com, microsoft.com, dll dari luar negeri. sedangkan portal SE dari indonesia adalah cangkok.com dan detiksearch.com (itu yang saya tahu).

Cara kerja SE adalah menggunakan rumus algoritma, jadi setiap ada website yang mempunyai data sesuai dengan kriteria yang dicari pengunjung, SE akan menampilkan keyword yang sesuai dimasukan pengunjung.
Search Engine akan berusaha mungkin menampilkan data yang paling relevan dengan yang diinginkan pengunjung. Berbagai kemungkinan data yang akan ditampilkan, dan search engine punya banyak pertimbangan yang dituangkan dalam algoritmanya.
Algoritma ini terus berkembang karena perkembangan teknologi yang ada di samping banyak website yang berusaha agar website dia muncul di halaman pertama hasil pencarian.


Mesin pencari


Mesin pencari
Mesin pencari adalah program komputer yang dirancang untuk melakukan pencarian atas berkas-berkas yang tersimpan dalam layanan www, ftp, publikasi milis, ataupun news group dalam sebuah ataupun sejumlah komputer peladen dalam suatu jaringan. Hasil pencarian umumnya ditampilkan dalam bentuk daftar yang seringkali diurutkan menurut tingkat akurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai hits. Informasi yang menjadi target pencarian bisa terdapat dalam berbagai macam jenis berkas seperti halaman situs web, gambar, ataupun jenis-jenis berkas lainnya. Beberapa mesin pencari juga diketahui melakukan pengumpulan informasi atas data yang tersimpan dalam suatu basisdata ataupun direktori web.
Sebagian besar mesin pencari dijalankan oleh perusahaan swasta yang menggunakan algoritma kepemilikan dan basisdata tertutup, di antaranya yang paling populer adalah Google (MSN Search dan Yahoo!). Telah ada beberapa upaya menciptakan mesin pencari dengan sumber terbuka (open source), contohnya adalah Htdig, Nutch, Egothor dan OpenFTS.


Cara kerja mesin pencari

Mesin pencari web bekerja dengan cara menyimpan informasi tentang banyak halaman web, yang diambil langsung dari WWW. Halaman-halaman ini diambil dengan web crawlerbrowser web otomatis yang mengikuti setiap pranala yang dilihatnya. Isi setiap halaman lalu dianalisis untuk menentukan cara indeks-nya (misalnya, kata-kata diambil dari judul, subjudul, atau field khusus yang disebut meta tag). Data tentang halaman web disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari, seperti Google, menyimpan seluruh atau sebagian halaman sumber (yang disebut cache) maupun informasi tentang halaman web itu sendiri.
Selain halaman web, Mesin pencari juga menyimpan dan memberikan informasi hasil pencarian berupa pranala yang merujuk pada file, seperti file audio, file video, gambar, foto dan sebagainya, serta informasi tentang seseorang, suatu produk, layanan, dan informasi beragam lainnya yang semakin terus berkembang sesuai dengan perkembangan teknologi informasi.
Ketika seseorang mengunjungi mesin pencari dan memasukkan query, biasanya dengan memasukkan kata kunci, mesin mencari indeks dan memberikan daftar halaman web yang paling sesuai dengan kriterianya, biasanya disertai ringkasan singkat mengenai judul dokumen dan kadang-kadang sebagian teksnya.
Ada jenis mesin pencari lain: mesin pencari real-time, seperti Orase. Mesin seperti ini tidak menggunakan indeks. Informasi yang diperlukan mesin tersebut hanya dikumpulkan jika ada pencarian baru. Jika dibandingkan dengan sistem berbasis indeks yang digunakan mesin-mesin seperti Google, sistem real-time ini unggul dalam beberapa hal: informasi selalu mutakhir, (hampir) tak ada pranala mati, dan lebih sedikit sumber daya sistem yang diperlukan. (Google menggunakan hampir 100.000 komputer, Orase hanya satu.) Tetapi, ada juga kelemahannya: pencarian lebih lama rampungnya.
Manfaat mesin pencari bergantung pada relevansi hasil-hasil yang diberikannya. Meskipun mungkin ada jutaan halaman web yang mengandung suatu kata atau frasa, sebagian halaman mungkin lebih relevan, populer, atau autoritatif daripada yang lain. Kebanyakan mesin pencari menggunakan berbagai metode untuk menentukan peringkat hasil pencarian agar mampu memberikan hasil "terbaik" lebih dahulu. Cara mesin menentukan halaman mana yang paling sesuai, dan urutan halaman-halaman itu diperlihatkan, sangat bervariasi. Metode-metode nya juga berubah seiring waktu dengan berubahnya penggunaan internet dan berevolusinya teknik-teknik baru.
Sebagian besar mesin pencari web adalah usaha komersial yang didukung pemasukan iklan dan karenanya sebagian menjalankan praktik kontroversial, yaitu membolehkan pengiklan membayar agar halaman mereka diberi peringkat lebih tinggi dalam hasil pencarian.


Prinsip Umum Dari mesin pencari

Sistem kinerja mesin ini ada beberapa hal yang perlu di perhatikan terutama keterkaitannya dengan masalah arsitekrut dan mekanismenya.

Spider

Merupakan program yang men-download halaman-halaman yang mereka temukan, mirip dengan browser. Perbedannya adalah bahwa browser menapilkan secara langsung informasi yang ada (baik tekas, gambar, dll). Untuk kepentingan manusia yang menggunakannya pada saat itu, sedangkan spider tidak melakukan untuk menampulkan dalam bentuk yang terlihat seperti itu, karena kepentingannya adalah untuk mesin, bukan untuk manusia, spider pun dijalankan oleh mesin secara otomatis. Kepentingannya adalah untuk mengambil halaman-halaman yang dikunjunginya untuk disimpan kedalam database yang dimiliki oleh search engine.

Crawler

Merupakan program yang dimiliki search engine untuk melacak dan menemukan link yang terdapat dari setiap halaman yang ditemuinya. Tugasnya adalah untuk menentukan spoder harus pergi kemana dan mengevaluasi link berdasarkan alamat yang ditentukan dari awal. Crawler mengikuti link dan mencoba menemukan dokumen yang belum dikenal oleh search engine.

Indexer

Komponen ini melakukan aktifitas untuk menguraikan masing-masing halaman dan meneliti berbagai unsur, seperti teks, headers, struktur atau fitur dari gaya penulisan, tag HTML khusus, dll.

Database

Merupakan tempat standar untuk menyimpan data-data dari halaman yang telah dikunjungi, di-download dan sudah dianalisis. kadang kala disebut juga dengan index dari suatu search engine.

Result Engine

Mesin yang melakukan penggolongan dan penentuan peringkat dari hasil pencarian pada search engine. Mesin ini menentukan halaman mana yang menemui kriteria terbaik dari hasil pencarian berdasarkan permintaan penggunanya, dan bagaimana bentuk penampulan yang akan ditampilkan.
Proses ini dilaksanakan berdasarkan algoritma perangkingan yang dimiliki oleh search engine tersebut, mengikuti kaidah perangkingan hakaman yang dipergunakan oleh mereka adalah hak mereka, para peneliti mempelajari sifat-sifat yang mereka gunakan, terutama untuk meningkatkan pencarian yang dihasilkan oleh serach engine tersebut.

Web Server

Merupakan komponen yang melayani permintaan dan memberikan respon balik dari permintaan tersebut. Web Server ini biasanya menghasilkan informasi atau dokumen dalam format HTML. Pada halaman tersebut tersedia layanan untuk mengisikan kata kunci pencarian yang diinginkan oleh usernya. Web Server ini juga bertanggung jawab dalam menyampaikan hasil pencarian yang dikirimkan kepada komputer yang meminta informasi.


Mesin pencari populer

Terdapat ratusan bahkan ribuan mesin pencari yang ada di internet, dan kapasitas mesin tersebut akan selalu tumbuh dari waktu ke waktu. Dari sebanyak itu, hanya sebagian kecil yang berpengaruh besar dalam lalulintas untuk pengantar pengunjungnya ke situs tersebut. untuk itu, harus pintar dalam memilih mereka yang tepat terutama dalam efisiensi dan efektifitas waktu yang anda miliki dalam mencapai sasaran yang diinginkan, karena situs yang tidak terlalu populer belum tentu akan berpengaruh besar terhadap pertumbuhanke situs yang dikelola. Apalagi juka pendaftaran situs-situs penyedia layanan pencarian tersebut dilakukan satu persatu, akan membuang waktu. Cara mudahnya, lebih baik menggunakan software pendaftar ke mesin pencari yang banyak beredar di internet, sehingga proses pendaftaran bisa dilakukan secara otomatis melalui software tersebut.
Berikut ini adalah beberapa mesin pencari:
  1. Google ( http://www.google.com/ )
  2. Yahoo ( http://www.yahoo.com/ )
  3. Open Directory ( http://www.dmoz.com/ )
  4. MSN ( http://www.msn.com/ )
  5. Live ( http://www.live.com )
  6. Altavista ( http://www.altavista.com )
  7. AOL ( http://www.aol.com )
  8. Altheweb ( http://www.althweb.com )
  9. Baidu ( http://www.baidu.com )
  10. Looksmart ( http://www.looksmart.com )
  11. Solusee ( http://www.solusee.com )

1 komentar: