What's new

Closed Mga master jan sa programming at website developer pasok.

Status
Not open for further replies.

PHC-Sammyhernz

Forum Veteran
Joined
May 5, 2016
Posts
1,479
Reaction
734
Points
522
Sa mga master jan sa website developing, master sa programming, at may alam sa web crawling, may mga tut. ba kayo na pweding pag kuhanan, or kayo gumawa for thesis namin all about web crawling. welling to pay mga boss.
 
Gumawa ka sa blogger ng website tapos copy XML and e paste mo nalang sa c++ mo. Wala naman maraming tanong yung instructor ko tinignan lang nya design ng website ko then I passed.
 
Crawling ba or scraping? Kapag crawling Illist lang lahat ng links/URL ng website kapag web scrapping May kukuhain na data.
 
You do not have permission to view the full content of this post. Log in or register now.

php xpath po last time ung gamit ko pang web scraping.

gumawa ako ng bot para ma kuha lahat ng details ng lahat ng phone ng isang brand sa gsm arena.

so depende po sir sa purpose ng crawler ang gagawin nyu.
 
You do not have permission to view the full content of this post. Log in or register now.

php xpath po last time ung gamit ko pang web scraping.

gumawa ako ng bot para ma kuha lahat ng details ng lahat ng phone ng isang brand sa gsm arena.

so depende po sir sa purpose ng crawler ang gagawin nyu.
You do not have permission to view the full content of this post. Log in or register now.

php xpath po last time ung gamit ko pang web scraping.

gumawa ako ng bot para ma kuha lahat ng details ng lahat ng phone ng isang brand sa gsm arena.

so depende po sir sa purpose ng crawler ang gagawin nyu.
yung samin po kasi boss all about emergency response so bali yung gagawin namin pag nag search ng location bali lalabas lahat ng emergency response na malapit sa search mong location. so bali boss yung keyword namin is location.
 
Mahirap yan. Oras ng tao ang hinihingi mo. Peru swerte ka papsy kapag may tumulong hehehe. Tapos future mo pa nakataya jan. Try mo ang Python at BeautifulSoup. By the way anong programming language ba papsy? Mas ok Python kasi more on DATA yata yan...

1. You do not have permission to view the full content of this post. Log in or register now.
2. You do not have permission to view the full content of this post. Log in or register now.
 
yung samin po kasi boss all about emergency response so bali yung gagawin namin pag nag search ng location bali lalabas lahat ng emergency response na malapit sa search mong location. so bali boss yung keyword namin is location.
sir hindi po web crawler ung kailangan nyu, data miner po,mostly wala naman pong websites ang mga emergency response group, meaning manually nyu pong hanaping at eh encode sa database ang locations ng bawat emergency responders.
 
sir hindi po web crawler ung kailangan nyu, data miner po,mostly wala naman pong websites ang mga emergency response group, meaning manually nyu pong hanaping at eh encode sa database ang locations ng bawat emergency responders.
ano ba kaibahan ng web crawler sa data mining boss, ang sabi kasi ng prof. namin web crawling daw gagawa kami ng portal na all about emergency response, so lahat ng government agency na may emergency response kukunin namin yung location nun tapos yung hotline number, para pag nag search sa search bar lalabas lahat ng emergency response na malapit sa na search mong location, so kapag sunog ang nangyari malapit sa inyo pipiliin mo yung fire station hotline number at yun ang tatawagan mo, kasi naka display na dun yung lahat ng emergency response pipiliin mo nalang yung dapat rumespundi sa inyo.
 
ano ba kaibahan ng web crawler sa data mining boss, ang sabi kasi ng prof. namin web crawling daw gagawa kami ng portal na all about emergency response, so lahat ng government agency na may emergency response kukunin namin yung location nun tapos yung hotline number, para pag nag search sa search bar lalabas lahat ng emergency response na malapit sa na search mong location, so kapag sunog ang nangyari malapit sa inyo pipiliin mo yung fire station hotline number at yun ang tatawagan mo, kasi naka display na dun yung lahat ng emergency response pipiliin mo nalang yung dapat rumespundi sa inyo.
sir ung web crawler is for web indexing para po sa mga search engine like google, data mining is collecting data for database and machine use.

so kung gusto mong eh crawl ang web for emergency phone numbers, pano mo ma lalaman kng active pa ang phone? or accurate ung data na kinukuha ng crawler?

madali lng naman sir ung thesis nyu, kilangan nyu lng eh collect lahat ng emergency responders at details nila then lagay sa database at gumawa ng script para mag output ng search result sa query ng use.

example pag may data sa kayu:
sql query - SELECT * FROM database WHERE location = $input;
ang magiging output po ay lahat ng responders sa location na nilagay ng user.
 
sir ung web crawler is for web indexing para po sa mga search engine like google, data mining is collecting data for database and machine use.

so kung gusto mong eh crawl ang web for emergency phone numbers, pano mo ma lalaman kng active pa ang phone? or accurate ung data na kinukuha ng crawler?

madali lng naman sir ung thesis nyu, kilangan nyu lng eh collect lahat ng emergency responders at details nila then lagay sa database at gumawa ng script para mag output ng search result sa query ng use.

example pag may data sa kayu:
sql query - SELECT * FROM database WHERE location = $input;
ang magiging output po ay lahat ng responders sa location na nilagay ng user.
yun nga sana gusto namin boss kaso sabi prof. namin dapat daw yung galing sa internet so wala kaming database na gagamitin boss pag nag search kami sa internet sya maghahanap,
 
yun nga sana gusto namin boss kaso sabi prof. namin dapat daw yung galing sa internet so wala kaming database na gagamitin boss pag nag search kami sa internet sya maghahanap,
ah then sir ito kilangan nyu You do not have permission to view the full content of this post. Log in or register now.

d2 ka po kukuha ng links para sa crawler You do not have permission to view the full content of this post. Log in or register now.

then code mo lng po ung algorithm para sa search levels, example pag may nakitang link na hindi listed sa previous 1000 links ay lalagay din sa indexed sites.

first search level mo ung 1000 list
second search level is ung sites na nasa loob ng 1000 list
then third level and so on.

basically gagawa ka ng sarili mong search engine.

suggestion ko po is sa malakas na PC ka mag run ng first indexing mo, para hindi mag hang at ma wala lahat ng indexed sites mo. then weekly mag index ka ulit ng sites baka may bagong update.

pag naka index ka na ng site, gumawa ka ng search engine na mag hahanap ng websites na may hotline ng emergency responders sa indexed sites mo.

P.S.:
naka dependi ang indexing speed sa internet at PC mo, ung crawler sa tutorial is single thread lng, pwede mong eh modify for multi-threading para mas mabilis ung indexing, basta malakas lng PC at internet mo.


sana maka tulong, good luck sir, naka gawa ako ng crawler kaso ung data na hinahanap ko is nasa isang site lng, ung sa inyu eh buong WWW kng pwede po kayo maka hanap ng advice sa naka gawa na mas mabuti.
 
ah then sir ito kilangan nyu You do not have permission to view the full content of this post. Log in or register now.

d2 ka po kukuha ng links para sa crawler You do not have permission to view the full content of this post. Log in or register now.

then code mo lng po ung algorithm para sa search levels, example pag may nakitang link na hindi listed sa previous 1000 links ay lalagay din sa indexed sites.

first search level mo ung 1000 list
second search level is ung sites na nasa loob ng 1000 list
then third level and so on.

basically gagawa ka ng sarili mong search engine.

suggestion ko po is sa malakas na PC ka mag run ng first indexing mo, para hindi mag hang at ma wala lahat ng indexed sites mo. then weekly mag index ka ulit ng sites baka may bagong update.

pag naka index ka na ng site, gumawa ka ng search engine na mag hahanap ng websites na may hotline ng emergency responders sa indexed sites mo.

P.S.:
naka dependi ang indexing speed sa internet at PC mo, ung crawler sa tutorial is single thread lng, pwede mong eh modify for multi-threading para mas mabilis ung indexing, basta malakas lng PC at internet mo.


sana maka tulong, good luck sir, naka gawa ako ng crawler kaso ung data na hinahanap ko is nasa isang site lng, ung sa inyu eh buong WWW kng pwede po kayo maka hanap ng advice sa naka gawa na mas mabuti.
salamat madami boss, pwede ba boss maka request kung ano po mga gagamitin para maka create ng web crawler, may na search kasi ako boss kailangan daw ng spider tool para sa crawling.
 
salamat madami boss, pwede ba boss maka request kung ano po mga gagamitin para maka create ng web crawler, may na search kasi ako boss kailangan daw ng spider tool para sa crawling.

php sir,

PHP:
$file_handle = fopen("urllist.txt", "r"); 
while (!feof($file_handle)) 
{ 
$url = trim(fgets($file_handle));
$content = file_get_contents($url); 
$document = array($url,$content); 
$serialized = serialize($document); 
$fp = fopen('./documents/'.md5($url), 'w'); 
fwrite($fp, $serialized); fclose($fp); 
} 

fclose($file_handle);

yan lng po ang code ng crawler, eh open ng crawler lahat ng sites sa urllist.txt then sasave nya lahat ng content sa txt file. single thread at 1 level lng po yan, kilangan mong eh modify para maging multi threaded.
 
php sir,

PHP:
$file_handle = fopen("urllist.txt", "r");
while (!feof($file_handle))
{
$url = trim(fgets($file_handle));
$content = file_get_contents($url);
$document = array($url,$content);
$serialized = serialize($document);
$fp = fopen('./documents/'.md5($url), 'w');
fwrite($fp, $serialized); fclose($fp);
}

fclose($file_handle);

yan lng po ang code ng crawler, eh open ng crawler lahat ng sites sa urllist.txt then sasave nya lahat ng content sa txt file. single thread at 1 level lng po yan, kilangan mong eh modify para maging multi threaded.
so dapat boss mag cre create kami ng urllist niyan?
 
Status
Not open for further replies.

Similar threads

Back
Top