Fix Cyanide & Happiness filter and add unit test
[rhynodge.git] / src / main / java / net / pterodactylus / rhynodge / filters / comics / CyanideAndHappinessComicFilter.java
1 /*
2  * rhynodge - CyanideAndHappinessComicFilter.java - Copyright © 2013 David Roden
3  *
4  * This program is free software: you can redistribute it and/or modify
5  * it under the terms of the GNU General Public License as published by
6  * the Free Software Foundation, either version 3 of the License, or
7  * (at your option) any later version.
8  *
9  * This program is distributed in the hope that it will be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12  * GNU General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public License
15  * along with this program.  If not, see <http://www.gnu.org/licenses/>.
16  */
17
18 package net.pterodactylus.rhynodge.filters.comics;
19
20 import java.net.URI;
21 import java.net.URISyntaxException;
22 import java.net.URL;
23 import java.util.Collections;
24 import java.util.List;
25
26 import net.pterodactylus.rhynodge.filters.ComicSiteFilter;
27
28 import com.google.common.base.Function;
29 import com.google.common.base.Optional;
30 import com.google.common.collect.FluentIterable;
31 import org.jsoup.nodes.Document;
32 import org.jsoup.nodes.Element;
33 import org.jsoup.select.Elements;
34
35 /**
36  * {@link ComicSiteFilter} implementation that can parse Cyanide and Happiness
37  * comics.
38  *
39  * @author <a href="mailto:bombe@pterodactylus.net">David ‘Bombe’ Roden</a>
40  */
41 public class CyanideAndHappinessComicFilter extends ComicSiteFilter {
42
43         @Override
44         protected Optional<String> extractTitle(Document document) {
45                 return Optional.absent();
46         }
47
48         @Override
49         protected List<String> extractImageUrls(Document document) {
50                 Elements imageTags = document.select("img#main-comic");
51                 return FluentIterable.from(imageTags).transform(new Function<Element, String>() {
52
53                         @Override
54                         public String apply(Element input) {
55                                 String imageUrl = input.attr("src");
56                                 try {
57                                         return new URI(document.baseUri()).resolve(imageUrl).toString();
58                                 } catch (URISyntaxException e) {
59                                         /* ignore. */
60                                 }
61                                 if (!imageUrl.startsWith("/")) {
62                                         return imageUrl;
63                                 }
64                                 String protocol = document.baseUri().substring(0, document.baseUri().indexOf('/'));
65                                 return protocol + imageUrl;
66                         }
67                 }).toList();
68         }
69
70         @Override
71         protected List<String> extractImageComments(Document document) {
72                 return Collections.emptyList();
73         }
74
75 }