ilk olarak, "levenshtein uzaklığı" dedikleri bir metrik var, iki harf/sembol dizisinin ["string" diyeler] benzerliğini-benzemezliğini ölçmek için kullanılabiliyor (bir dizinin öbürüne dönüştürülmesi için çıkarma, ekleme ve değiştirme türünden kaç işlem yapılması gerektiği üzerinden..) , sonra "difflib" diye bir python modülü var, onunla da iki dizi arasındaki çakışmalar aranabiliyor. bir de "re" diye güzel ve kafa karıştırıcı bir modül var, bir sembol örüntüsünü bir sembol dizisi içinde aramayı sağlıyor. nerde, ne kadarlık bir kısmı, kaç adet bulundu vd... ilk bakışta elimde yeteri kadar araç var gibi.
bir plan düzenlemesi önerisinden plan birimlerinin dizilimini satırlar ve kolonlar halinde elde ediyorum. sonra onların içinde bir takım kelimeleri [örüntüleri ya da sembol dizilerini] arıyorum. bunun için doğru yöntemi bulmam lazım. sorun şurda, elimdeki araçlar bir örüntüyü bir dizide aramak, ya da iki diziyi karşılaştırmak üzerine kurulmuş gibi görünüyor. ama benim bir diziyi bir örüntüde (örüntüyü dizide değil) aramak için bir yöntem bulmam lazım. bu tip problemler uğraştığım konuların hem heyecanlı hem de korkutucu kısımları işte. belki problemi tersten kurgulayabilirim? örüntüyü dizide arayarak çözülebilecek şekilde...
5 Eylül 2010 Pazar
Kaydol:
Kayıt Yorumları (Atom)
Hiç yorum yok:
Yorum Gönder