Získanie html kódu stránky   otázka

VB.NET

Dobrý deň,

neviem ako získať zdrojový kód www stránky.

Vo web browsery si otvorím stránku, keď si chcem cez watch pozrieť zdrojový kód stránky, tak získam nasledovné údaje

<HTML><HEAD><TITLE>SYMES IV : XXXX s.r.o.</TITLE>
<META content="text/html; charset=windows-1250" http-equiv=Content-Type></HEAD><FRAMESET frameSpacing=0 border=0 cols=120,* frameBorder=0><FRAME style="FONT-FAMILY: Arial, Helvetica, sans-serif" src="menu.php" name=obsahGM525aaea29d221><FRAME src="list.php" name=listGM525aaea29d221><NOFRAMES></NOFRAMES></FRAMESET></HTML>

keď si pomocou webbrowsera dám zobraziť zdrojový kód stránky tak dostanem súbor ktorý má cez 7000 riadkov kódu.

Ako pomocou vb.net získam celý kód stránky?

Ďakujem

nahlásit spamnahlásit spam 0 odpovědětodpovědět

Ahoj.

Na zpracování html doporučuji html agility pack...

http://htmlagilitypack.codeplex.com/

stránku načteš takto:

HtmlDocument hdoc = new HtmlWeb().Load("http://www.tvojeadres.cz")

a pak si vybíráš nody, atd... na to je tutoriálů dosti.

krom html agility packu, můžeš využít ještě LinqToHtml, funguje stejně jako LinqToXml, ale nejde nainstalovat přes nuget(půl roku stará informace) - což není takový problém...

Tohle se týká zpracování HTML, jestli chceš jenom načíst, tak to půjde bez předchozích knihoven.

Co s tím chceš dělat?

nahlásit spamnahlásit spam 0 odpovědětodpovědět

No vzhledem k tomu, že jsou tam FRAME, tak byste musel načíst i jejich zdroje tj. menu.php a list.php. Webbrowser Vám nejspíše zobrazuje zdroj jednoho z tech FRAMU, ve kterém vyvoláte zobrazení zdrojového kódu.

nahlásit spamnahlásit spam 0 odpovědětodpovědět

Môžete mi prosím naznačiť akým spôsobom môžem načítať zdroje FRAMES.

Ďakujem

nahlásit spamnahlásit spam 0 odpovědětodpovědět

například přes již zmíněný html agility pack načíst stránku, přes LinqToHtml si vzít všechny hodnoty atributů 'src' na elementech typu Frame...

a tyto jednotlivé url adresy opět načíst...

jen pozor: cesty jsou uvedeny relativně, tak je třeba dotaz pro získání dat opět složit jako: http://www.web.domena/frame_src

nahlásit spamnahlásit spam 1 / 1 odpovědětodpovědět
                       
Nadpis:
Antispam: Komu se občas házejí perly?
Příspěvek bude publikován pod identitou   anonym.
  • Administrátoři si vyhrazují právo komentáře upravovat či mazat bez udání důvodu.
    Mazány budou zejména komentáře obsahující vulgarity nebo porušující pravidla publikování.
  • Pokud nejste zaregistrováni, Vaše IP adresa bude zveřejněna. Pokud s tímto nesouhlasíte, příspěvek neodesílejte.

přihlásit pomocí externího účtu

přihlásit pomocí jména a hesla

Uživatel:
Heslo:

zapomenuté heslo

 

založit nový uživatelský účet

zaregistrujte se

 
zavřít

Nahlásit spam

Opravdu chcete tento příspěvek nahlásit pro porušování pravidel fóra?

Nahlásit Zrušit

Chyba

zavřít

feedback