跳过导航链接
A B C D E F G H I J K L M N O P Q R S T U V Z 

A

addPageModel(Class) - 类 中的方法cn.spark2fire.jscrapy.model.ModelPageProcessor
 
addPageModel(PageModelPipeline, Class...) - 类 中的方法cn.spark2fire.jscrapy.model.OOSpider
 
addSubPageProcessor(SubPageProcessor) - 类 中的方法cn.spark2fire.jscrapy.entity.CompositePageProcessor
 
addSubPipeline(SubPipeline) - 类 中的方法cn.spark2fire.jscrapy.entity.CompositePipeline
 
AfterExtractor - cn.spark2fire.jscrapy.model中的接口
Interface to be implemented by page models that need to do something after fields are extracted.
afterProcess(Page) - 接口 中的方法cn.spark2fire.jscrapy.model.AfterExtractor
 
AppStore - cn.spark2fire.jscrapy.example中的类
 
AppStore() - 类 的构造器cn.spark2fire.jscrapy.example.AppStore
 
author - 类 中的变量cn.spark2fire.jscrapy.example.GithubRepo
 
author - 类 中的变量cn.spark2fire.jscrapy.example.GithubRepoApi
 

B

BaiduBaike - cn.spark2fire.jscrapy.example中的类
 
BaiduBaike() - 类 的构造器cn.spark2fire.jscrapy.example.BaiduBaike
 
BasicTypeFormatter<T> - cn.spark2fire.jscrapy.model.formatter中的类
 
BasicTypeFormatter() - 类 的构造器cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter
 
BasicTypeFormatter.BooleanFormatter - cn.spark2fire.jscrapy.model.formatter中的类
 
BasicTypeFormatter.ByteFormatter - cn.spark2fire.jscrapy.model.formatter中的类
 
BasicTypeFormatter.CharactorFormatter - cn.spark2fire.jscrapy.model.formatter中的类
 
BasicTypeFormatter.DoubleFormatter - cn.spark2fire.jscrapy.model.formatter中的类
 
BasicTypeFormatter.FloatFormatter - cn.spark2fire.jscrapy.model.formatter中的类
 
BasicTypeFormatter.IntegerFormatter - cn.spark2fire.jscrapy.model.formatter中的类
 
BasicTypeFormatter.LongFormatter - cn.spark2fire.jscrapy.model.formatter中的类
 
BasicTypeFormatter.ShortFormatter - cn.spark2fire.jscrapy.model.formatter中的类
 
basicTypeFormatters - 类 中的静态变量cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter
 
bloomFilter - 类 中的变量cn.spark2fire.jscrapy.scheduler.BloomFilterDuplicateRemover
 
BloomFilterDuplicateRemover - cn.spark2fire.jscrapy.scheduler中的类
BloomFilterDuplicateRemover for huge number of urls.
BloomFilterDuplicateRemover(int) - 类 的构造器cn.spark2fire.jscrapy.scheduler.BloomFilterDuplicateRemover
 
BloomFilterDuplicateRemover(int, double) - 类 的构造器cn.spark2fire.jscrapy.scheduler.BloomFilterDuplicateRemover
 
BooleanFormatter() - 类 的构造器cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.BooleanFormatter
 
build() - 类 中的方法cn.spark2fire.jscrapy.model.formatter.ObjectFormatterBuilder
 
ByteFormatter() - 类 的构造器cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.ByteFormatter
 

C

CharactorFormatter() - 类 的构造器cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.CharactorFormatter
 
checkForAdditionalInfo(Request) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisScheduler
 
classPipeline - 类 中的变量cn.spark2fire.jscrapy.model.PageModelCollectorPipeline
 
ClassUtils - cn.spark2fire.jscrapy.utils中的类
 
ClassUtils() - 类 的构造器cn.spark2fire.jscrapy.utils.ClassUtils
 
clazz() - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.BooleanFormatter
 
clazz() - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.ByteFormatter
 
clazz() - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.CharactorFormatter
 
clazz() - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.DoubleFormatter
 
clazz() - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.FloatFormatter
 
clazz() - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.IntegerFormatter
 
clazz() - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.LongFormatter
 
clazz() - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.ShortFormatter
 
clazz() - 类 中的方法cn.spark2fire.jscrapy.model.formatter.DateFormatter
 
clazz() - 接口 中的方法cn.spark2fire.jscrapy.model.formatter.ObjectFormatter
 
clazz - 类 中的变量cn.spark2fire.jscrapy.model.PageMapper
 
clazz - 类 中的变量cn.spark2fire.jscrapy.model.PageModelCollectorPipeline
 
clazz - 类 中的变量cn.spark2fire.jscrapy.model.PageModelExtractor
 
close() - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
cn.spark2fire.jscrapy - 程序包 cn.spark2fire.jscrapy
 
cn.spark2fire.jscrapy.configurable - 程序包 cn.spark2fire.jscrapy.configurable
 
cn.spark2fire.jscrapy.downloader - 程序包 cn.spark2fire.jscrapy.downloader
 
cn.spark2fire.jscrapy.entity - 程序包 cn.spark2fire.jscrapy.entity
 
cn.spark2fire.jscrapy.example - 程序包 cn.spark2fire.jscrapy.example
 
cn.spark2fire.jscrapy.model - 程序包 cn.spark2fire.jscrapy.model
Page model and annotations used to customize a crawler.
cn.spark2fire.jscrapy.model.annotation - 程序包 cn.spark2fire.jscrapy.model.annotation
Annotations for defining a extractor.
cn.spark2fire.jscrapy.model.formatter - 程序包 cn.spark2fire.jscrapy.model.formatter
 
cn.spark2fire.jscrapy.monitor - 程序包 cn.spark2fire.jscrapy.monitor
 
cn.spark2fire.jscrapy.pipeline - 程序包 cn.spark2fire.jscrapy.pipeline
 
cn.spark2fire.jscrapy.scheduler - 程序包 cn.spark2fire.jscrapy.scheduler
 
cn.spark2fire.jscrapy.utils - 程序包 cn.spark2fire.jscrapy.utils
 
collected - 类 中的变量cn.spark2fire.jscrapy.pipeline.CollectorPageModelPipeline
 
CollectorPageModelPipeline<T> - cn.spark2fire.jscrapy.pipeline中的类
 
CollectorPageModelPipeline() - 类 的构造器cn.spark2fire.jscrapy.pipeline.CollectorPageModelPipeline
 
combine(MultiPageModel) - 接口 中的方法cn.spark2fire.jscrapy.MultiPageModel
Combine multiPageModels to a whole object.
ComboExtract - cn.spark2fire.jscrapy.model.annotation中的注释类型
Combo 'ExtractBy' extractor with and/or operator.
ComboExtract.Op - cn.spark2fire.jscrapy.model.annotation中的枚举
 
ComboExtract.Source - cn.spark2fire.jscrapy.model.annotation中的枚举
types of source for extracting.
compileSelector() - 类 中的方法cn.spark2fire.jscrapy.configurable.ExtractRule
 
CompositePageProcessor - cn.spark2fire.jscrapy.entity中的类
 
CompositePageProcessor(Site) - 类 的构造器cn.spark2fire.jscrapy.entity.CompositePageProcessor
 
CompositePipeline - cn.spark2fire.jscrapy.entity中的类
 
CompositePipeline() - 类 的构造器cn.spark2fire.jscrapy.entity.CompositePipeline
 
ConfigurablePageProcessor - cn.spark2fire.jscrapy.configurable中的类
 
ConfigurablePageProcessor(Site, List<ExtractRule>) - 类 的构造器cn.spark2fire.jscrapy.configurable.ConfigurablePageProcessor
 
ConsolePageModelPipeline - cn.spark2fire.jscrapy.model中的类
Print page model in console.
ConsolePageModelPipeline() - 类 的构造器cn.spark2fire.jscrapy.model.ConsolePageModelPipeline
 
content - 类 中的变量cn.spark2fire.jscrapy.example.OschinaBlog
 
convert(String, ObjectFormatter) - 类 中的方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
convert(List<String>, ObjectFormatter) - 类 中的方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
counter - 类 中的变量cn.spark2fire.jscrapy.scheduler.BloomFilterDuplicateRemover
 
crawlJsPath - 类 中的静态变量cn.spark2fire.jscrapy.downloader.PhantomJSDownloader
 
create(Site, Class...) - 类 中的静态方法cn.spark2fire.jscrapy.model.ModelPageProcessor
 
create(Site, Class...) - 类 中的静态方法cn.spark2fire.jscrapy.model.OOSpider
 
create(Site, PageModelPipeline, Class...) - 类 中的静态方法cn.spark2fire.jscrapy.model.OOSpider
 
create(Class) - 类 中的静态方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
cursor - 类 中的变量cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 

D

date - 类 中的变量cn.spark2fire.jscrapy.example.OschinaBlog
 
DateFormatter - cn.spark2fire.jscrapy.model.formatter中的类
 
DateFormatter() - 类 的构造器cn.spark2fire.jscrapy.model.formatter.DateFormatter
 
datePatterns - 类 中的变量cn.spark2fire.jscrapy.model.formatter.DateFormatter
 
DEFAULT_CLAZZ - 类 中的静态变量cn.spark2fire.jscrapy.utils.MultiKeyMapBase
 
DEFAULT_FORMATTER - 注释类型 中的静态变量cn.spark2fire.jscrapy.model.annotation.Formatter
 
DEFAULT_PATTERN - 类 中的静态变量cn.spark2fire.jscrapy.model.formatter.DateFormatter
 
description - 类 中的变量cn.spark2fire.jscrapy.example.AppStore
 
description - 类 中的变量cn.spark2fire.jscrapy.example.BaiduBaike
 
deserializeRequest(String) - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
detectBasicClass(Class<?>) - 类 中的静态方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter
 
DoubleFormatter() - 类 的构造器cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.DoubleFormatter
 
DoubleKeyMap<K1,K2,V> - cn.spark2fire.jscrapy.utils中的类
 
DoubleKeyMap() - 类 的构造器cn.spark2fire.jscrapy.utils.DoubleKeyMap
 
DoubleKeyMap(Map<K1, Map<K2, V>>) - 类 的构造器cn.spark2fire.jscrapy.utils.DoubleKeyMap
 
DoubleKeyMap(Class<? extends Map>) - 类 的构造器cn.spark2fire.jscrapy.utils.DoubleKeyMap
 
DoubleKeyMap(Map<K1, Map<K2, V>>, Class<? extends Map>) - 类 的构造器cn.spark2fire.jscrapy.utils.DoubleKeyMap
init map with protoMapClass
download(Request, Task) - 类 中的方法cn.spark2fire.jscrapy.downloader.PhantomJSDownloader
 

E

errorCount - 类 中的变量cn.spark2fire.jscrapy.monitor.SpiderMonitor.MonitorSpiderListener
 
errorUrls - 类 中的变量cn.spark2fire.jscrapy.monitor.SpiderMonitor.MonitorSpiderListener
 
expectedInsertions - 类 中的变量cn.spark2fire.jscrapy.scheduler.BloomFilterDuplicateRemover
 
expressionParams - 类 中的变量cn.spark2fire.jscrapy.configurable.ExtractRule
 
ExpressionType - cn.spark2fire.jscrapy.configurable中的枚举
 
ExpressionType() - 枚举 的构造器cn.spark2fire.jscrapy.configurable.ExpressionType
 
expressionType - 类 中的变量cn.spark2fire.jscrapy.configurable.ExtractRule
 
expressionValue - 类 中的变量cn.spark2fire.jscrapy.configurable.ExtractRule
 
ExtractBy - cn.spark2fire.jscrapy.model.annotation中的注释类型
Define the extractor for field or class.
ExtractBy.Source - cn.spark2fire.jscrapy.model.annotation中的枚举
types of source for extracting.
ExtractBy.Type - cn.spark2fire.jscrapy.model.annotation中的枚举
types of extractor expressions
ExtractByUrl - cn.spark2fire.jscrapy.model.annotation中的注释类型
Define a extractor to extract data in url of current page.
extractLinks - 类 中的变量cn.spark2fire.jscrapy.model.ModelPageProcessor
 
extractLinks(Page, Selector, List<Pattern>) - 类 中的方法cn.spark2fire.jscrapy.model.ModelPageProcessor
 
Extractor - cn.spark2fire.jscrapy.model中的类
The object contains 'ExtractBy' information.
Extractor(Selector, Extractor.Source, boolean, boolean) - 类 的构造器cn.spark2fire.jscrapy.model.Extractor
 
Extractor.Source - cn.spark2fire.jscrapy.model中的枚举
 
ExtractorUtils - cn.spark2fire.jscrapy.utils中的类
Tools for annotation converting.
ExtractorUtils() - 类 的构造器cn.spark2fire.jscrapy.utils.ExtractorUtils
 
ExtractRule - cn.spark2fire.jscrapy.configurable中的类
 
ExtractRule() - 类 的构造器cn.spark2fire.jscrapy.configurable.ExtractRule
 
extractRules - 类 中的变量cn.spark2fire.jscrapy.configurable.ConfigurablePageProcessor
 

F

field - 类 中的变量cn.spark2fire.jscrapy.model.FieldExtractor
 
field - 类 中的变量cn.spark2fire.jscrapy.model.formatter.ObjectFormatterBuilder
 
FieldExtractor - cn.spark2fire.jscrapy.model中的类
Wrapper of field and extractor.
FieldExtractor(Field, Selector, Extractor.Source, boolean, boolean) - 类 的构造器cn.spark2fire.jscrapy.model.FieldExtractor
 
fieldExtractors - 类 中的变量cn.spark2fire.jscrapy.model.PageModelExtractor
 
fieldName - 类 中的变量cn.spark2fire.jscrapy.configurable.ExtractRule
 
FileCacheQueueScheduler - cn.spark2fire.jscrapy.scheduler中的类
Store urls and cursor in files so that a Spider can resume the status when shutdown.
FileCacheQueueScheduler(String) - 类 的构造器cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
fileCursor - 类 中的变量cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
fileCursorWriter - 类 中的变量cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
FilePageModelPipeline - cn.spark2fire.jscrapy.pipeline中的类
Store results objects (page models) to files in plain format.
FilePageModelPipeline() - 类 的构造器cn.spark2fire.jscrapy.pipeline.FilePageModelPipeline
new JsonFilePageModelPipeline with default path "/data/webmagic/"
FilePageModelPipeline(String) - 类 的构造器cn.spark2fire.jscrapy.pipeline.FilePageModelPipeline
 
filePath - 类 中的变量cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
fileUrlAllName - 类 中的变量cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
fileUrlWriter - 类 中的变量cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
FloatFormatter() - 类 的构造器cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.FloatFormatter
 
flush() - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
flushThreadPool - 类 中的变量cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
fork - 类 中的变量cn.spark2fire.jscrapy.example.GithubRepo
 
fork - 类 中的变量cn.spark2fire.jscrapy.example.GithubRepoApi
 
format(String) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter
 
format(String) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.DateFormatter
 
format(String) - 接口 中的方法cn.spark2fire.jscrapy.model.formatter.ObjectFormatter
 
Formatter - cn.spark2fire.jscrapy.model.annotation中的注释类型
Define how the result string is convert to an object for field.
formatterMap - 类 中的静态变量cn.spark2fire.jscrapy.model.formatter.ObjectFormatters
 
formatTrimmed(String) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.BooleanFormatter
 
formatTrimmed(String) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.ByteFormatter
 
formatTrimmed(String) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.CharactorFormatter
 
formatTrimmed(String) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.DoubleFormatter
 
formatTrimmed(String) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.FloatFormatter
 
formatTrimmed(String) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter
 
formatTrimmed(String) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.IntegerFormatter
 
formatTrimmed(String) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.LongFormatter
 
formatTrimmed(String) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.ShortFormatter
 
fpp - 类 中的变量cn.spark2fire.jscrapy.scheduler.BloomFilterDuplicateRemover
 
from(String) - 类 中的静态方法cn.spark2fire.jscrapy.utils.RequestUtils
 

G

get(Class<?>) - 类 中的静态方法cn.spark2fire.jscrapy.model.formatter.ObjectFormatters
 
get(Page) - 类 中的方法cn.spark2fire.jscrapy.model.PageMapper
 
get(String, Class<T>) - 类 中的方法cn.spark2fire.jscrapy.SimpleHttpClient
 
get(Request, Class<T>) - 类 中的方法cn.spark2fire.jscrapy.SimpleHttpClient
 
get(String) - 类 中的方法cn.spark2fire.jscrapy.SimpleHttpClient
 
get(Request) - 类 中的方法cn.spark2fire.jscrapy.SimpleHttpClient
 
get(K1) - 类 中的方法cn.spark2fire.jscrapy.utils.DoubleKeyMap
 
get(K1, K2) - 类 中的方法cn.spark2fire.jscrapy.utils.DoubleKeyMap
 
getAll(Page) - 类 中的方法cn.spark2fire.jscrapy.model.PageMapper
 
getAnnotationExtractBy(Class, Field) - 类 中的方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
getAnnotationExtractByUrl(Class, Field) - 类 中的方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
getAnnotationExtractCombo(Class, Field) - 类 中的方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
getAuthor() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepo
 
getAuthor() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepoApi
 
getClazz() - 类 中的方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
getCollected() - 类 中的方法cn.spark2fire.jscrapy.model.PageModelCollectorPipeline
 
getCollected() - 类 中的方法cn.spark2fire.jscrapy.pipeline.CollectorPageModelPipeline
 
getCollectorPipeline() - 类 中的方法cn.spark2fire.jscrapy.model.OOSpider
 
getContent() - 类 中的方法cn.spark2fire.jscrapy.example.OschinaBlog
 
getDate() - 类 中的方法cn.spark2fire.jscrapy.example.OschinaBlog
 
getDescription() - 类 中的方法cn.spark2fire.jscrapy.example.BaiduBaike
 
getErrorCount() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderMonitor.MonitorSpiderListener
 
getErrorPageCount() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatus
 
getErrorPageCount() - 接口 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatusMXBean
 
getErrorPages() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatus
 
getErrorPages() - 接口 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatusMXBean
 
getErrorUrls() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderMonitor.MonitorSpiderListener
 
getExpressionParams() - 类 中的方法cn.spark2fire.jscrapy.configurable.ExtractRule
 
getExpressionType() - 类 中的方法cn.spark2fire.jscrapy.configurable.ExtractRule
 
getExpressionValue() - 类 中的方法cn.spark2fire.jscrapy.configurable.ExtractRule
 
getExtrasInItem(Jedis, String, Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
getField() - 类 中的方法cn.spark2fire.jscrapy.model.FieldExtractor
 
getFieldName() - 类 中的方法cn.spark2fire.jscrapy.configurable.ExtractRule
 
getFieldsIncludeSuperClass(Class) - 类 中的静态方法cn.spark2fire.jscrapy.utils.ClassUtils
 
getFileName(String) - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
getFirstNoLoopbackIPAddresses() - 类 中的静态方法cn.spark2fire.jscrapy.utils.IPUtils
 
getFork() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepo
 
getFork() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepoApi
 
getHelpUrlPatterns() - 类 中的方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
getHelpUrlRegionSelector() - 类 中的方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
getItemKey(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisScheduler
 
getLanguage() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepo
 
getLanguage() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepoApi
 
getLeftPageCount() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatus
 
getLeftPageCount() - 接口 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatusMXBean
 
getLeftRequestsCount(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
getLeftRequestsCount(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisScheduler
 
getName() - 类 中的方法cn.spark2fire.jscrapy.example.BaiduBaike
 
getName() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepo
 
getName() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepoApi
 
getName() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatus
 
getName() - 接口 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatusMXBean
 
getObjectFormatter() - 类 中的方法cn.spark2fire.jscrapy.model.FieldExtractor
 
getOtherPages() - 接口 中的方法cn.spark2fire.jscrapy.MultiPageModel
other pages to be extracted.
getPage(Request) - 类 中的方法cn.spark2fire.jscrapy.downloader.PhantomJSDownloader
 
getPage() - 接口 中的方法cn.spark2fire.jscrapy.MultiPageModel
page is the identifier of a page in pages for one object.
getPageKey() - 接口 中的方法cn.spark2fire.jscrapy.MultiPageModel
Page key is the identifier for the object.
getPagePerSecond() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatus
 
getPagePerSecond() - 接口 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatusMXBean
 
getQueueKey(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisScheduler
 
getQueueNoPriorityKey(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
getReadme() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepo
 
getRequest(Jedis, Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
getRetryNum() - 类 中的方法cn.spark2fire.jscrapy.downloader.PhantomJSDownloader
 
getSelector() - 类 中的方法cn.spark2fire.jscrapy.configurable.ExtractRule
 
getSelector() - 类 中的方法cn.spark2fire.jscrapy.model.Extractor
 
getSelector() - 类 中的方法cn.spark2fire.jscrapy.model.FieldExtractor
 
getSelector(ExtractBy) - 类 中的静态方法cn.spark2fire.jscrapy.utils.ExtractorUtils
 
getSelectors(ExtractBy[]) - 类 中的静态方法cn.spark2fire.jscrapy.utils.ExtractorUtils
 
getSetKey(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisScheduler
 
getSetterMethod() - 类 中的方法cn.spark2fire.jscrapy.model.FieldExtractor
 
getSetterMethod(Class, Field) - 类 中的静态方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
getSite() - 类 中的方法cn.spark2fire.jscrapy.configurable.ConfigurablePageProcessor
 
getSite() - 类 中的方法cn.spark2fire.jscrapy.entity.CompositePageProcessor
 
getSite() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepoPageMapper
 
getSite() - 类 中的方法cn.spark2fire.jscrapy.model.ModelPageProcessor
 
getSource() - 类 中的方法cn.spark2fire.jscrapy.model.Extractor
 
getSource() - 类 中的方法cn.spark2fire.jscrapy.model.FieldExtractor
 
getSpiderStatuses() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderMonitor
 
getSpiderStatusMBean(Spider, SpiderMonitor.MonitorSpiderListener) - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderMonitor
 
getStar() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepo
 
getStar() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepoApi
 
getStartTime() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatus
 
getStartTime() - 接口 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatusMXBean
 
getStatus() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatus
 
getStatus() - 接口 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatusMXBean
 
getSuccessCount() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderMonitor.MonitorSpiderListener
 
getSuccessPageCount() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatus
 
getSuccessPageCount() - 接口 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatusMXBean
 
getTags() - 类 中的方法cn.spark2fire.jscrapy.example.OschinaBlog
 
getTargetUrlPatterns() - 类 中的方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
getTargetUrlRegionSelector() - 类 中的方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
getThread() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatus
 
getThread() - 接口 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatusMXBean
 
getTitle() - 类 中的方法cn.spark2fire.jscrapy.example.OschinaBlog
 
getTotalPageCount() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatus
 
getTotalPageCount() - 接口 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatusMXBean
 
getTotalRequestsCount(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.BloomFilterDuplicateRemover
 
getTotalRequestsCount(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
getTotalRequestsCount(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisScheduler
 
getUrl() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepo
 
getUrl() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepoApi
 
getUrl(Request) - 类 中的方法cn.spark2fire.jscrapy.scheduler.BloomFilterDuplicateRemover
 
getZsetMinusPriorityKey(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
getZsetPlusPriorityKey(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
GithubRepo - cn.spark2fire.jscrapy.example中的类
 
GithubRepo() - 类 的构造器cn.spark2fire.jscrapy.example.GithubRepo
 
GithubRepoApi - cn.spark2fire.jscrapy.example中的类
 
GithubRepoApi() - 类 的构造器cn.spark2fire.jscrapy.example.GithubRepoApi
 
GithubRepoPageMapper - cn.spark2fire.jscrapy.example中的类
 
GithubRepoPageMapper() - 类 的构造器cn.spark2fire.jscrapy.example.GithubRepoPageMapper
 
githubRepoPageMapper - 类 中的变量cn.spark2fire.jscrapy.example.GithubRepoPageMapper
 

H

handleObject(Iterator<Map.Entry<String, Object>>) - 类 中的方法cn.spark2fire.jscrapy.pipeline.MultiPagePipeline
 
HasKey - cn.spark2fire.jscrapy.model中的接口
Interface to be implemented by page mode.
HelpUrl - cn.spark2fire.jscrapy.model.annotation中的注释类型
Define the 'help' url patterns for class.
helpUrlPatterns - 类 中的变量cn.spark2fire.jscrapy.model.PageModelExtractor
 
helpUrlRegionSelector - 类 中的变量cn.spark2fire.jscrapy.model.PageModelExtractor
 
httpClientDownloader - 类 中的变量cn.spark2fire.jscrapy.SimpleHttpClient
 

I

init(Class) - 类 中的方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
init(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
init() - 类 中的方法cn.spark2fire.jscrapy.utils.DoubleKeyMap
 
initClassExtractors() - 类 中的方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
initDuplicateRemover() - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
inited - 类 中的变量cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
initFlushThread() - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
initFormatter(Class<? extends ObjectFormatter>, String[]) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.ObjectFormatterBuilder
 
initFormatterForType(Class<?>, String[]) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.ObjectFormatterBuilder
 
initParam(String[]) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter
 
initParam(String[]) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.DateFormatter
 
initParam(String[]) - 接口 中的方法cn.spark2fire.jscrapy.model.formatter.ObjectFormatter
 
initPhantomjsCrawlPath() - 类 中的方法cn.spark2fire.jscrapy.downloader.PhantomJSDownloader
 
initWriter() - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
INSTANCE - 类 中的静态变量cn.spark2fire.jscrapy.monitor.SpiderMonitor
 
instance() - 类 中的静态方法cn.spark2fire.jscrapy.monitor.SpiderMonitor
 
IntegerFormatter() - 类 的构造器cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.IntegerFormatter
 
IPUtils - cn.spark2fire.jscrapy.utils中的类
 
IPUtils() - 类 的构造器cn.spark2fire.jscrapy.utils.IPUtils
 
isDuplicate(Request, Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.BloomFilterDuplicateRemover
 
isDuplicate(Request, Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisScheduler
 
isExtractLinks() - 类 中的方法cn.spark2fire.jscrapy.model.ModelPageProcessor
 
isMulti() - 类 中的方法cn.spark2fire.jscrapy.configurable.ExtractRule
 
isMulti() - 类 中的方法cn.spark2fire.jscrapy.model.Extractor
 
isNotNull() - 类 中的方法cn.spark2fire.jscrapy.configurable.ExtractRule
 
isNotNull() - 类 中的方法cn.spark2fire.jscrapy.model.Extractor
 
isNotNull() - 类 中的方法cn.spark2fire.jscrapy.model.FieldExtractor
 
ITEM_PREFIX - 类 中的静态变量cn.spark2fire.jscrapy.scheduler.RedisScheduler
 

J

jmxServerName - 类 中的变量cn.spark2fire.jscrapy.monitor.SpiderMonitor
 
JsonFilePageModelPipeline - cn.spark2fire.jscrapy.pipeline中的类
Store results objects (page models) to files in JSON format.
JsonFilePageModelPipeline() - 类 的构造器cn.spark2fire.jscrapy.pipeline.JsonFilePageModelPipeline
new JsonFilePageModelPipeline with default path "/data/webmagic/"
JsonFilePageModelPipeline(String) - 类 的构造器cn.spark2fire.jscrapy.pipeline.JsonFilePageModelPipeline
 
JsonFilePipeline - cn.spark2fire.jscrapy.pipeline中的类
Store results to files in JSON format.
JsonFilePipeline() - 类 的构造器cn.spark2fire.jscrapy.pipeline.JsonFilePipeline
new JsonFilePageModelPipeline with default path "/data/webmagic/"
JsonFilePipeline(String) - 类 的构造器cn.spark2fire.jscrapy.pipeline.JsonFilePipeline
 

K

key() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepo
 
key() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepoApi
 
key() - 接口 中的方法cn.spark2fire.jscrapy.model.HasKey
 

L

language - 类 中的变量cn.spark2fire.jscrapy.example.GithubRepo
 
language - 类 中的变量cn.spark2fire.jscrapy.example.GithubRepoApi
 
log - 类 中的静态变量cn.spark2fire.jscrapy.example.PatternProcessorExample
 
logger - 类 中的静态变量cn.spark2fire.jscrapy.downloader.PhantomJSDownloader
 
logger - 类 中的变量cn.spark2fire.jscrapy.model.PageModelExtractor
 
logger - 类 中的变量cn.spark2fire.jscrapy.monitor.SpiderMonitor
 
logger - 类 中的变量cn.spark2fire.jscrapy.monitor.SpiderStatus
 
logger - 类 中的变量cn.spark2fire.jscrapy.pipeline.FilePageModelPipeline
 
logger - 类 中的变量cn.spark2fire.jscrapy.pipeline.JsonFilePageModelPipeline
 
logger - 类 中的变量cn.spark2fire.jscrapy.pipeline.JsonFilePipeline
 
LongFormatter() - 类 的构造器cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.LongFormatter
 

M

main(String[]) - 类 中的静态方法cn.spark2fire.jscrapy.example.AppStore
 
main(String[]) - 类 中的静态方法cn.spark2fire.jscrapy.example.BaiduBaike
 
main(String[]) - 类 中的静态方法cn.spark2fire.jscrapy.example.GithubRepo
 
main(String[]) - 类 中的静态方法cn.spark2fire.jscrapy.example.GithubRepoApi
 
main(String[]) - 类 中的静态方法cn.spark2fire.jscrapy.example.GithubRepoPageMapper
 
main(String[]) - 类 中的静态方法cn.spark2fire.jscrapy.example.MonitorExample
 
main(String[]) - 类 中的静态方法cn.spark2fire.jscrapy.example.OschinaBlog
 
main(String...) - 类 中的静态方法cn.spark2fire.jscrapy.example.PatternProcessorExample
 
map - 类 中的变量cn.spark2fire.jscrapy.utils.DoubleKeyMap
 
match(Request) - 类 中的方法cn.spark2fire.jscrapy.entity.PatternRequestMatcher
 
match(Request) - 接口 中的方法cn.spark2fire.jscrapy.entity.RequestMatcher
Check whether to process the page.
MatchOther() - 枚举 的构造器cn.spark2fire.jscrapy.entity.RequestMatcher.MatchOther
 
mbeanServer - 类 中的变量cn.spark2fire.jscrapy.monitor.SpiderMonitor
 
MINUS_PRIORITY_SUFFIX - 类 中的静态变量cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
ModelPageProcessor - cn.spark2fire.jscrapy.model中的类
The extension to PageProcessor for page model extractor.
ModelPageProcessor(Site) - 类 的构造器cn.spark2fire.jscrapy.model.ModelPageProcessor
 
modelPageProcessor - 类 中的变量cn.spark2fire.jscrapy.model.OOSpider
 
ModelPipeline - cn.spark2fire.jscrapy.model中的类
The extension to Pipeline for page model extractor.
ModelPipeline() - 类 的构造器cn.spark2fire.jscrapy.model.ModelPipeline
 
modelPipeline - 类 中的变量cn.spark2fire.jscrapy.model.OOSpider
 
MonitorExample - cn.spark2fire.jscrapy.example中的类
 
MonitorExample() - 类 的构造器cn.spark2fire.jscrapy.example.MonitorExample
 
MonitorSpiderListener() - 类 的构造器cn.spark2fire.jscrapy.monitor.SpiderMonitor.MonitorSpiderListener
 
monitorSpiderListener - 类 中的变量cn.spark2fire.jscrapy.monitor.SpiderStatus
 
multi - 类 中的变量cn.spark2fire.jscrapy.configurable.ExtractRule
 
multi - 类 中的变量cn.spark2fire.jscrapy.model.Extractor
 
MultiKeyMapBase - cn.spark2fire.jscrapy.utils中的类
multi-key map, some basic objects *
MultiKeyMapBase() - 类 的构造器cn.spark2fire.jscrapy.utils.MultiKeyMapBase
 
MultiKeyMapBase(Class<? extends Map>) - 类 的构造器cn.spark2fire.jscrapy.utils.MultiKeyMapBase
 
MultiPageModel - cn.spark2fire.jscrapy中的接口
Extract an object of more than one pages, such as news and articles.
MultiPagePipeline - cn.spark2fire.jscrapy.pipeline中的类
A pipeline combines the result in more than one page together.
MultiPagePipeline() - 类 的构造器cn.spark2fire.jscrapy.pipeline.MultiPagePipeline
 

N

name - 类 中的变量cn.spark2fire.jscrapy.example.BaiduBaike
 
name - 类 中的变量cn.spark2fire.jscrapy.example.GithubRepo
 
name - 类 中的变量cn.spark2fire.jscrapy.example.GithubRepoApi
 
newMap() - 类 中的方法cn.spark2fire.jscrapy.utils.MultiKeyMapBase
 
NO_PRIORITY_SUFFIX - 类 中的静态变量cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
notNull - 类 中的变量cn.spark2fire.jscrapy.configurable.ExtractRule
 
notNull - 类 中的变量cn.spark2fire.jscrapy.model.Extractor
 

O

objectExtractor - 类 中的变量cn.spark2fire.jscrapy.model.PageModelExtractor
 
objectFormatter - 类 中的变量cn.spark2fire.jscrapy.model.FieldExtractor
 
ObjectFormatter<T> - cn.spark2fire.jscrapy.model.formatter中的接口
 
ObjectFormatterBuilder - cn.spark2fire.jscrapy.model.formatter中的类
 
ObjectFormatterBuilder() - 类 的构造器cn.spark2fire.jscrapy.model.formatter.ObjectFormatterBuilder
 
ObjectFormatters - cn.spark2fire.jscrapy.model.formatter中的类
 
ObjectFormatters() - 类 的构造器cn.spark2fire.jscrapy.model.formatter.ObjectFormatters
 
objectMap - 类 中的变量cn.spark2fire.jscrapy.pipeline.MultiPagePipeline
 
onError(Request) - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderMonitor.MonitorSpiderListener
 
onSuccess(Request) - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderMonitor.MonitorSpiderListener
 
OOSpider<T> - cn.spark2fire.jscrapy.model中的类
The spider for page model extractor.
OOSpider(ModelPageProcessor) - 类 的构造器cn.spark2fire.jscrapy.model.OOSpider
 
OOSpider(PageProcessor) - 类 的构造器cn.spark2fire.jscrapy.model.OOSpider
 
OOSpider(Site, PageModelPipeline, Class...) - 类 的构造器cn.spark2fire.jscrapy.model.OOSpider
create a spider
Op() - 枚举 的构造器cn.spark2fire.jscrapy.model.annotation.ComboExtract.Op
 
OschinaBlog - cn.spark2fire.jscrapy.example中的类
 
OschinaBlog() - 类 的构造器cn.spark2fire.jscrapy.example.OschinaBlog
 

P

p4Range - 类 中的静态变量cn.spark2fire.jscrapy.utils.RequestUtils
 
pageMap - 类 中的变量cn.spark2fire.jscrapy.pipeline.MultiPagePipeline
 
PageMapper<T> - cn.spark2fire.jscrapy.model中的类
 
PageMapper(Class<T>) - 类 的构造器cn.spark2fire.jscrapy.model.PageMapper
 
pageModelClasses - 类 中的变量cn.spark2fire.jscrapy.model.OOSpider
 
PageModelCollectorPipeline<T> - cn.spark2fire.jscrapy.model中的类
 
PageModelCollectorPipeline(Class<?>) - 类 的构造器cn.spark2fire.jscrapy.model.PageModelCollectorPipeline
 
pageModelExtractor - 类 中的变量cn.spark2fire.jscrapy.model.PageMapper
 
PageModelExtractor - cn.spark2fire.jscrapy.model中的类
The main internal logic of page model extractor.
PageModelExtractor() - 类 的构造器cn.spark2fire.jscrapy.model.PageModelExtractor
 
pageModelExtractorList - 类 中的变量cn.spark2fire.jscrapy.model.ModelPageProcessor
 
pageModelPipeline - 类 中的变量cn.spark2fire.jscrapy.model.OOSpider
 
PageModelPipeline<T> - cn.spark2fire.jscrapy.pipeline中的接口
Implements PageModelPipeline to persistent your page model.
pageModelPipelines - 类 中的变量cn.spark2fire.jscrapy.model.ModelPipeline
 
pattern - 类 中的变量cn.spark2fire.jscrapy.entity.PatternRequestMatcher
match pattern. only matched page should be handled.
patternCompiled - 类 中的变量cn.spark2fire.jscrapy.entity.PatternRequestMatcher
 
PatternProcessor - cn.spark2fire.jscrapy.entity中的类
 
PatternProcessor(String) - 类 的构造器cn.spark2fire.jscrapy.entity.PatternProcessor
 
PatternProcessorExample - cn.spark2fire.jscrapy.example中的类
Created with IntelliJ IDEA.
PatternProcessorExample() - 类 的构造器cn.spark2fire.jscrapy.example.PatternProcessorExample
 
PatternRequestMatcher - cn.spark2fire.jscrapy.entity中的类
Created with IntelliJ IDEA.
PatternRequestMatcher(String) - 类 的构造器cn.spark2fire.jscrapy.entity.PatternRequestMatcher
 
phantomJsCommand - 类 中的静态变量cn.spark2fire.jscrapy.downloader.PhantomJSDownloader
 
PhantomJSDownloader - cn.spark2fire.jscrapy.downloader中的类
this downloader is used to download pages which need to render the javascript
PhantomJSDownloader() - 类 的构造器cn.spark2fire.jscrapy.downloader.PhantomJSDownloader
 
PhantomJSDownloader(String) - 类 的构造器cn.spark2fire.jscrapy.downloader.PhantomJSDownloader
添加新的构造函数,支持phantomjs自定义命令 example: phantomjs.exe 支持windows环境 phantomjs --ignore-ssl-errors=yes 忽略抓取地址是https时的一些错误 /usr/local/bin/phantomjs 命令的绝对路径,避免因系统环境变量引起的IOException
PhantomJSDownloader(String, String) - 类 的构造器cn.spark2fire.jscrapy.downloader.PhantomJSDownloader
新增构造函数,支持crawl.js路径自定义,因为当其他项目依赖此jar包时,runtime.exec()执行phantomjs命令时无使用法jar包中的crawl.js crawl.js start -- var system = require('system'); var url = system.args[1]; var page = require('webpage').create(); page.settings.loadImages = false; page.settings.resourceTimeout = 5000; page.open(url, function (status) { if (status !
PLUS_PRIORITY_SUFFIX - 类 中的静态变量cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
poll(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
poll(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
poll(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisScheduler
 
pool - 类 中的变量cn.spark2fire.jscrapy.scheduler.RedisScheduler
 
postProcessPageModel(Class, Object) - 类 中的方法cn.spark2fire.jscrapy.model.ModelPageProcessor
 
process(Page) - 类 中的方法cn.spark2fire.jscrapy.configurable.ConfigurablePageProcessor
 
process(Page) - 类 中的方法cn.spark2fire.jscrapy.entity.CompositePageProcessor
 
process(ResultItems, Task) - 类 中的方法cn.spark2fire.jscrapy.entity.CompositePipeline
 
process(Page) - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepoPageMapper
 
process(Object, Task) - 类 中的方法cn.spark2fire.jscrapy.model.ConsolePageModelPipeline
 
process(Page) - 类 中的方法cn.spark2fire.jscrapy.model.ModelPageProcessor
 
process(ResultItems, Task) - 类 中的方法cn.spark2fire.jscrapy.model.ModelPipeline
 
process(ResultItems, Task) - 类 中的方法cn.spark2fire.jscrapy.model.PageModelCollectorPipeline
 
process(Page) - 类 中的方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
process(T, Task) - 类 中的方法cn.spark2fire.jscrapy.pipeline.CollectorPageModelPipeline
 
process(Object, Task) - 类 中的方法cn.spark2fire.jscrapy.pipeline.FilePageModelPipeline
 
process(Object, Task) - 类 中的方法cn.spark2fire.jscrapy.pipeline.JsonFilePageModelPipeline
 
process(ResultItems, Task) - 类 中的方法cn.spark2fire.jscrapy.pipeline.JsonFilePipeline
 
process(ResultItems, Task) - 类 中的方法cn.spark2fire.jscrapy.pipeline.MultiPagePipeline
 
process(T, Task) - 接口 中的方法cn.spark2fire.jscrapy.pipeline.PageModelPipeline
 
processPage(Page) - 接口 中的方法cn.spark2fire.jscrapy.entity.SubPageProcessor
process the page, extract urls to fetch, extract the data and store
processResult(ResultItems, Task) - 接口 中的方法cn.spark2fire.jscrapy.entity.SubPipeline
process the page, extract urls to fetch, extract the data and store
processSingle(Page, String, boolean) - 类 中的方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
protoMapClass - 类 中的变量cn.spark2fire.jscrapy.utils.MultiKeyMapBase
 
pushWhenNoDuplicate(Request, Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
pushWhenNoDuplicate(Request, Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
pushWhenNoDuplicate(Request, Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisScheduler
 
put(Class<? extends ObjectFormatter>) - 类 中的静态方法cn.spark2fire.jscrapy.model.formatter.ObjectFormatters
 
put(Class, PageModelPipeline) - 类 中的方法cn.spark2fire.jscrapy.model.ModelPipeline
 
put(K1, Map<K2, V>) - 类 中的方法cn.spark2fire.jscrapy.utils.DoubleKeyMap
 
put(K1, K2, V) - 类 中的方法cn.spark2fire.jscrapy.utils.DoubleKeyMap
 

Q

queue - 类 中的变量cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
QUEUE_PREFIX - 类 中的静态变量cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
QUEUE_PREFIX - 类 中的静态变量cn.spark2fire.jscrapy.scheduler.RedisScheduler
 

R

readCursorFile() - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
readFile() - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
readme - 类 中的变量cn.spark2fire.jscrapy.example.GithubRepo
 
readUrlFile() - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
rebuildBloomFilter() - 类 中的方法cn.spark2fire.jscrapy.scheduler.BloomFilterDuplicateRemover
 
RedisPriorityScheduler - cn.spark2fire.jscrapy.scheduler中的类
the redis scheduler with priority
RedisPriorityScheduler(String) - 类 的构造器cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
RedisPriorityScheduler(JedisPool) - 类 的构造器cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
RedisScheduler - cn.spark2fire.jscrapy.scheduler中的类
Use Redis as url scheduler for distributed crawlers.
RedisScheduler(String) - 类 的构造器cn.spark2fire.jscrapy.scheduler.RedisScheduler
 
RedisScheduler(JedisPool) - 类 的构造器cn.spark2fire.jscrapy.scheduler.RedisScheduler
 
register(Spider...) - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderMonitor
Register spider for monitor.
registerMBean(SpiderStatusMXBean) - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderMonitor
 
remove(K1, K2) - 类 中的方法cn.spark2fire.jscrapy.utils.DoubleKeyMap
 
remove(K1) - 类 中的方法cn.spark2fire.jscrapy.utils.DoubleKeyMap
 
RequestMatcher - cn.spark2fire.jscrapy.entity中的接口
 
RequestMatcher.MatchOther - cn.spark2fire.jscrapy.entity中的枚举
 
RequestUtils - cn.spark2fire.jscrapy.utils中的类
 
RequestUtils() - 类 的构造器cn.spark2fire.jscrapy.utils.RequestUtils
 
resetDuplicateCheck(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.BloomFilterDuplicateRemover
 
resetDuplicateCheck(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
resetDuplicateCheck(Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisScheduler
 
retryNum - 类 中的变量cn.spark2fire.jscrapy.downloader.PhantomJSDownloader
 

S

screenshotUrls - 类 中的变量cn.spark2fire.jscrapy.example.AppStore
 
selector - 类 中的变量cn.spark2fire.jscrapy.configurable.ExtractRule
 
selector - 类 中的变量cn.spark2fire.jscrapy.model.Extractor
 
serializeRequest(Request) - 类 中的方法cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
SET_PREFIX - 类 中的静态变量cn.spark2fire.jscrapy.scheduler.RedisScheduler
 
setExpressionParams(String[]) - 类 中的方法cn.spark2fire.jscrapy.configurable.ExtractRule
 
setExpressionType(ExpressionType) - 类 中的方法cn.spark2fire.jscrapy.configurable.ExtractRule
 
setExpressionValue(String) - 类 中的方法cn.spark2fire.jscrapy.configurable.ExtractRule
 
setExtractLinks(boolean) - 类 中的方法cn.spark2fire.jscrapy.model.ModelPageProcessor
 
setExtrasInItem(Jedis, Request, Task) - 类 中的方法cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
setField(Field) - 类 中的方法cn.spark2fire.jscrapy.model.formatter.ObjectFormatterBuilder
 
setField(Object, FieldExtractor, Object) - 类 中的方法cn.spark2fire.jscrapy.model.PageModelExtractor
 
setFieldName(String) - 类 中的方法cn.spark2fire.jscrapy.configurable.ExtractRule
 
setIsExtractLinks(boolean) - 类 中的方法cn.spark2fire.jscrapy.model.OOSpider
 
setMulti(boolean) - 类 中的方法cn.spark2fire.jscrapy.configurable.ExtractRule
 
setNotNull(boolean) - 类 中的方法cn.spark2fire.jscrapy.configurable.ExtractRule
 
setObjectFormatter(ObjectFormatter) - 类 中的方法cn.spark2fire.jscrapy.model.FieldExtractor
 
setProxyProvider(ProxyProvider) - 类 中的方法cn.spark2fire.jscrapy.SimpleHttpClient
 
setRetryNum(int) - 类 中的方法cn.spark2fire.jscrapy.downloader.PhantomJSDownloader
 
setSelector(Selector) - 类 中的方法cn.spark2fire.jscrapy.configurable.ExtractRule
 
setSelector(Selector) - 类 中的方法cn.spark2fire.jscrapy.model.Extractor
 
setSetterMethod(Method) - 类 中的方法cn.spark2fire.jscrapy.model.FieldExtractor
 
setSite(Site) - 类 中的方法cn.spark2fire.jscrapy.entity.CompositePageProcessor
 
setSubPageProcessors(SubPageProcessor...) - 类 中的方法cn.spark2fire.jscrapy.entity.CompositePageProcessor
 
setSubPipeline(SubPipeline...) - 类 中的方法cn.spark2fire.jscrapy.entity.CompositePipeline
 
setterMethod - 类 中的变量cn.spark2fire.jscrapy.model.FieldExtractor
 
setThread(int) - 类 中的方法cn.spark2fire.jscrapy.downloader.PhantomJSDownloader
 
ShortFormatter() - 类 的构造器cn.spark2fire.jscrapy.model.formatter.BasicTypeFormatter.ShortFormatter
 
SimpleHttpClient - cn.spark2fire.jscrapy中的类
 
SimpleHttpClient() - 类 的构造器cn.spark2fire.jscrapy.SimpleHttpClient
 
SimpleHttpClient(Site) - 类 的构造器cn.spark2fire.jscrapy.SimpleHttpClient
 
site - 类 中的变量cn.spark2fire.jscrapy.configurable.ConfigurablePageProcessor
 
site - 类 中的变量cn.spark2fire.jscrapy.entity.CompositePageProcessor
 
site - 类 中的变量cn.spark2fire.jscrapy.example.GithubRepoPageMapper
 
site - 类 中的变量cn.spark2fire.jscrapy.model.ModelPageProcessor
 
site - 类 中的变量cn.spark2fire.jscrapy.SimpleHttpClient
 
Source() - 枚举 的构造器cn.spark2fire.jscrapy.model.annotation.ComboExtract.Source
 
Source() - 枚举 的构造器cn.spark2fire.jscrapy.model.annotation.ExtractBy.Source
 
source - 类 中的变量cn.spark2fire.jscrapy.model.Extractor
 
Source() - 枚举 的构造器cn.spark2fire.jscrapy.model.Extractor.Source
 
spider - 类 中的变量cn.spark2fire.jscrapy.monitor.SpiderStatus
 
SpiderMonitor - cn.spark2fire.jscrapy.monitor中的类
 
SpiderMonitor() - 类 的构造器cn.spark2fire.jscrapy.monitor.SpiderMonitor
 
SpiderMonitor.MonitorSpiderListener - cn.spark2fire.jscrapy.monitor中的类
 
SpiderStatus - cn.spark2fire.jscrapy.monitor中的类
 
SpiderStatus(Spider, SpiderMonitor.MonitorSpiderListener) - 类 的构造器cn.spark2fire.jscrapy.monitor.SpiderStatus
 
spiderStatuses - 类 中的变量cn.spark2fire.jscrapy.monitor.SpiderMonitor
 
SpiderStatusMXBean - cn.spark2fire.jscrapy.monitor中的接口
 
star - 类 中的变量cn.spark2fire.jscrapy.example.GithubRepo
 
star - 类 中的变量cn.spark2fire.jscrapy.example.GithubRepoApi
 
start() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatus
 
start() - 接口 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatusMXBean
 
started - 类 中的变量cn.spark2fire.jscrapy.monitor.SpiderMonitor
 
stop() - 类 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatus
 
stop() - 接口 中的方法cn.spark2fire.jscrapy.monitor.SpiderStatusMXBean
 
SubPageProcessor - cn.spark2fire.jscrapy.entity中的接口
 
subPageProcessors - 类 中的变量cn.spark2fire.jscrapy.entity.CompositePageProcessor
 
SubPipeline - cn.spark2fire.jscrapy.entity中的接口
 
subPipelines - 类 中的变量cn.spark2fire.jscrapy.entity.CompositePipeline
 
successCount - 类 中的变量cn.spark2fire.jscrapy.monitor.SpiderMonitor.MonitorSpiderListener
 
supportedDevices - 类 中的变量cn.spark2fire.jscrapy.example.AppStore
 

T

tags - 类 中的变量cn.spark2fire.jscrapy.example.OschinaBlog
 
TargetUrl - cn.spark2fire.jscrapy.model.annotation中的注释类型
Define the url patterns for class.
targetUrlPatterns - 类 中的变量cn.spark2fire.jscrapy.model.PageModelExtractor
 
targetUrlRegionSelector - 类 中的变量cn.spark2fire.jscrapy.model.PageModelExtractor
 
task - 类 中的变量cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
threadNum - 类 中的变量cn.spark2fire.jscrapy.downloader.PhantomJSDownloader
 
title - 类 中的变量cn.spark2fire.jscrapy.example.OschinaBlog
 
toString() - 类 中的方法cn.spark2fire.jscrapy.example.BaiduBaike
 
toString() - 类 中的方法cn.spark2fire.jscrapy.example.GithubRepo
 
trackName - 类 中的变量cn.spark2fire.jscrapy.example.AppStore
 
Type() - 枚举 的构造器cn.spark2fire.jscrapy.model.annotation.ExtractBy.Type
 

U

url - 类 中的变量cn.spark2fire.jscrapy.example.GithubRepo
 
url - 类 中的变量cn.spark2fire.jscrapy.example.GithubRepoApi
 
urls - 类 中的变量cn.spark2fire.jscrapy.scheduler.FileCacheQueueScheduler
 
userRatingCount - 类 中的变量cn.spark2fire.jscrapy.example.AppStore
 

V

valueOf(String) - 枚举 中的静态方法cn.spark2fire.jscrapy.configurable.ExpressionType
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法cn.spark2fire.jscrapy.entity.RequestMatcher.MatchOther
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法cn.spark2fire.jscrapy.model.annotation.ComboExtract.Op
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法cn.spark2fire.jscrapy.model.annotation.ComboExtract.Source
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法cn.spark2fire.jscrapy.model.annotation.ExtractBy.Source
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法cn.spark2fire.jscrapy.model.annotation.ExtractBy.Type
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法cn.spark2fire.jscrapy.model.Extractor.Source
返回带有指定名称的该类型的枚举常量。
values() - 枚举 中的静态方法cn.spark2fire.jscrapy.configurable.ExpressionType
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 枚举 中的静态方法cn.spark2fire.jscrapy.entity.RequestMatcher.MatchOther
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 枚举 中的静态方法cn.spark2fire.jscrapy.model.annotation.ComboExtract.Op
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 枚举 中的静态方法cn.spark2fire.jscrapy.model.annotation.ComboExtract.Source
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 枚举 中的静态方法cn.spark2fire.jscrapy.model.annotation.ExtractBy.Source
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 枚举 中的静态方法cn.spark2fire.jscrapy.model.annotation.ExtractBy.Type
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 枚举 中的静态方法cn.spark2fire.jscrapy.model.Extractor.Source
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。

Z

ZSET_PREFIX - 类 中的静态变量cn.spark2fire.jscrapy.scheduler.RedisPriorityScheduler
 
A B C D E F G H I J K L M N O P Q R S T U V Z 
跳过导航链接

Copyright © 2021. All rights reserved.