Diễn đàn
Tác giả Nội dung
Admin
Gửi: 20/07/04 21:08    Cải tiến chức năng Search
Administrator
Thành viên quen thuộc


Nhóm: Quản trị
Tham gia: 18/05/03
Bài gửi: 1/35
Nơi ở: TpHCM, Việt Nam

Chức năng Search ngay từ đầu đã được dự tính phát triển mạnh. Nhưng do bận làm các mục khác, nên phần Archive được mở ra với mục đích "dụ" google index nó và dùng trực tiếp google để search (hoặc gián tiếp, thông qua google API).

Sau đó, tính năng search của website vẫn được tăng cường, hiện tại đã đáp ứng các yêu cầu sau:

  • tìm từ riêng biệt hoặc cụm từ, chấp nhận các toán tá»­ bool (là AND và OR), và kết hợp tất cả các Ä‘iều trên
  • sắp xếp kết quả theo độ chính xác giảm dần
  • nhận ra được từ tiếng Việt, hiểu được các cách bỏ dấu khác nhau cá»§a 1 từ (hoà và hòa)
  • hiểu được khái niệm "gần kề" (thí dụ tìm từ A gần kề từ B, cách từ B dưới 10 từ khác...)

Tuy nhiên tốc độ vẫn còn rất chậm, nhất là khi các cụm từ dài độ 4-5 âm tiết thì câu query đã lên đến hàng chục dòng. Trong vài ngày tá»›i, tôi dá»± tính sẽ đưa ra má»™t phương thức má»›i, không tá»± tạo index mà sẽ nhờ MySQL tạo giùm   sau đó so sánh vá»›i tốc độ hiện nay (và tương lai, khi CSDL đạt ngưỡng 1GB - hiện nay là 400MB) để chọn phương pháp tốt nhất.

Rất mong muốn nhận được các góp ý về thuật toán.

Xem lý lịch thành viên Website của thành viên này
Xem bài trướcChức năng dá»± tínhXem bài kế
 

Bạn không có quyền gửi bài viết
Bạn được quyền trả lời bài viết