روش TF-IDF چیست ؟

TF-IDF که مخفف Term Frequency -Inverse Document Frequency می‌باشد و به معنای فراوانی وزنی کلمه کلیدی است. TF-IDF صرفا میزان تکرار یک کلمه کلیدی یا عبارت را در صفحه نشان نمی‌دهد، بلکه هدف آن نشان دادن اهمیت کلمه کلیدی مورد نظر از طریق مقایسه تعداد تکرار کلمه در متن با تکرار آن کلمه در مجموعه ای بزرگ تر از مستندات (کل صفحات سایت) می‌باشد.

به عنوان مثال اگر کلمه “سبد و سبد سهام” را با هم مقایسه نماییم در می‌یابیم که کلمه “سبد” بسیار بیشتر از “سبد سهام” مورد استفاده قرار می گیرید، بر مبنای تناوب تکرار این دو عبارت می توان نتیجه گرفت اگر عبارت “سبد سهام” در متنی تکرار شود کلمه مهمی است در صورتی که آستانه مهم در نظر گرفتن کلمه “سبد” بسیار بالاتر است!

TF-ID در مقابل افزونه هایی همچون یواست

TF-IDF در مقابل افزونه هایی همچون یواست

در واقع TF-IDF روشی است که از طریق آن وزن لگاریتمی کلمه کلیدی به دست می‌آید در حالی که افزونه‌هایی همچون یواست و افزونه های مشابه که در اختیار ما قرار می‌گیرند، فقط وزن غیر لگاریتمی کلمه کلیدی را محاسبه می‌نمایند و تمرکز اصلی آن ها صرفا روی تعداد دفعات تکرار کلمه کلیدی است و بنا بر تنظیمات آنها، هر زمان که تعداد تکرار کلمه کلیدی به صورت درصدی قابل قبول از کل متن ظاهر شود، آن متن را مناسب و هدفمند در نظر می‌گیرند در حالی که این امر اشتباه و یا حداقل روشی ناقصی است.

از آنجا که بسیاری از کانتنت نویسان به دلیل عدم دانش یا وقت گیر بودن استفاده از این روش، آن را در محتواهای خود مد نظر قرار نمی‌دهند، کسب و کار شما در صورت استفاده و توجه به روش استاندارد TF-IDF مطمئنا از محتوایی بسیار هدمند تر برخوردار خواهد بود و بدین روش تاثیر خوبی در سئو نهایی سایت خود خواهید داشت.

روش محاسبه TF-IDF

TF-IDF از دو عبارت TF به معنای محدوده فرکانس نرمال و IDF که فرکانس محتوایی معکوس نامیده می‌شود تشکیل شده است. برای به دست آوردن ضریب TF-IDF میبایست هر کدام از این دو عبارت را به صورت جداگانه محاسبه نموده و حاصل دو عبارت را در هم ضرب کنیم تا نتیجه حاصله، فراوانی وزنی کلمه کلیدی را به ما نشان دهد.

فرمول دو عبارت فوق به شرح زیر می باشد:
TF = عبارت است از تقسیم تعداد تکرار کلمه بر تعداد کل کلمات محتوا
IDF = عبارت است از لگاریتم تقسیم تعداد کل محتوا بر محتواهایی که شامل کلمه مورد نظر هستند.
(علت استفاده از لگاریتم در این فرمول این است که قصد داریم درون کل محتواهای سایت نرمال سازی انجام دهیم)

روش محاسبه TF-IDF

مثالی ساده برای درک بهتر TF-IDF

برای درک بهتر این موضوع، مثالی در مقیاس کوچک تر خواهیم زد و شما بدین طریق می توانید برای کل محتواهای سایت مورد نظرتان از روش TF-IDF استفاده نمایید.

فرض کنید حوزه کاری ما خرید و فروش گربه می باشد. سایت ما دارای سه مقاله فرضی به صورت زیر است:

  1. گربه ها موجودات دوست داشتنی هستند. برای برقرار کردن ارتباط به گربه ها می بایست زمان زیادی را صرف بازی و تربیت آنها نمود …( فرض کنید کل کلمات این محتوا ۳۶ کلمه است)
  2. برای خرید گربه راه های زیادی وجود دارد. یکی از این روش ها خرید گربه از دست فروش ها در بعضی خیابان های تهران می باشد. برای خرید گربه حتما نیاز است کارت شمناسایی همراه فرد باشد…
  3. حیوانات موجودات احساسی هستند. حقوق حیوانات از جمله مواردی است که می باید توسط همگی انسان ها رعایت شود….

در این جا کلمه مورد نظر ما ” گربه ” می باشد. برای به دست آوردن TF-IDF مقاله اول به صورت زیر عمل می کنیم .

 TF = عبارت است از تقسیم تعداد تکرار کلمه بر تعداد کل کلمات محتوا = ۰٫۰۵ = ۳۶ / ۲
IDF = عبارت است از لگاریتم تقسیم تعداد کل محتوا بر محتواهای شامل کلمه مورد نظر= ۱٫۵ = ۲ / ۳
TF-IDF = 0.05 * 1.5 = 0.075

TF-IDF به دست آمده فراوانی وزنی کلمه “گربه “ در مقاله اول را نشان می دهد. هر چه میزان TF-IDF بیشتر باشد بهتر و هر چه این عدد به صفر نزدیک تر باشد نشان می دهد که کلمه مورد نظر از اهمیت کمی در محتوا برخوردار است.

TF-IDF صرفا میزان تکرار یک کلمه کلیدی یا عبارت را در صفحه نشان نمی‌دهد، بلکه هدف آن نشان دادن اهمیت کلمه کلیدی مورد نظرمی‌باشد./

در صورت استفاده از روش TF-IDF سایت شما مربوط به هر کسب و کاری که باشد، نه تنها به ازای یک مقاله خاص، بلکه به ازای تمامی مطالبی که مربوط به کسب و کار شما می باشد در صورت جستجو توسط کاربر نمایش داده می‌شود.

نتیجه گیری

نکته بسیار مهم این است که منظور ما از این روش و استفاده از کلمه کلیدی در تمام متون وبسایت به این معنا نیست که کلمه کلیدی اصلی همه مقالات مشابه هم باشد. بلکه درست ترین روش این است که کلمه کلیدی هر مقاله با مقالات دیگر متفاوت باشد.

ما در این روش صرفا روی یک کلمه یا عبارتی تاکید داریم که بخش عمده ای از کسب و کارمان را نشان می دهد و فارغ از کلمه کلیدی اصلی می بایست TF-IDF این کلمه یا عبارت در کل سایت بالا باشد تا اهمیت آن به کاربر و همچنین به جستجوگرها و خزنده های گوگل نشان داده شود تا به ازای جستجوی آن عبارت، نه تنها یک صفحه از سایت ما ، بلکه کل سایت به کاربر نمایش داده شود.

توجه داشته باشید که شاخص TF-IDF تنها یک شاخص بسیار کوچک برای سئو سایت محسوب می شود و برای به دست آوردن رتبه بالاتر در نتایج گوگل نیاز است از دیگر شاخص های مورد نیاز برای رسیدن به رتبه بالاتر استفاده نمایید.

Sending
User Review
۰ (۰ votes)
1 نظر
  1. سهراب می گوید

    سلام
    چرا لگاریتم در idf نگرفتید و فقط سه را بر دو تقسیم کردید در مثال

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.